[v5,2/2] kvm: x86: hyperv: guest->host event signaling via eventfd

Message ID	20171212160742.793-3-rkagan@virtuozzo.com (mailing list archive)
State	New, archived
Headers	show Return-Path: <kvm-owner@kernel.org> From: Roman Kagan <rkagan@virtuozzo.com> To: kvm@vger.kernel.org, Paolo Bonzini <pbonzini@redhat.com>, =?UTF-8?q?Radim=20Kr=C4=8Dm=C3=A1=C5=99?= <rkrcmar@redhat.com> Cc: "Denis V. Lunev" <den@openvz.org>, Konrad Rzeszutek Wilk <konrad.wilk@oracle.com>, Vitaly Kuznetsov <vkuznets@redhat.com>, David Hildenbrand <david@redhat.com> Subject: [PATCH v5 2/2] kvm: x86: hyperv: guest->host event signaling via eventfd Date: Tue, 12 Dec 2017 19:07:42 +0300 Message-Id: <20171212160742.793-3-rkagan@virtuozzo.com> In-Reply-To: <20171212160742.793-1-rkagan@virtuozzo.com> References: <20171212160742.793-1-rkagan@virtuozzo.com> MIME-Version: 1.0 Content-Type: text/plain Received-SPF: None (protection.outlook.com: virtuozzo.com does not designate permitted sender hosts) X-Microsoft-Exchange-Diagnostics: =?us-ascii?Q?1; HE1PR08MB0843; 23:FxbnpdFZV/s4h1nawIVkwW84ImvHt2tJc3QhuWcJl?= =?us-ascii?Q?jAOq3pHOI+42FtH6UpNBrUELi+mXIUE0h81TDgl9REfrDbY1et5hPH0hLMWh?= =?us-ascii?Q?wNFgeqKnrxOg+EksQrzTJWLnMwnI/Y2crC37Fkz41mtg7r4NE5jx6TLjWWHd?= =?us-ascii?Q?+YO0pk0GvOCNyxMb52ZTTQ+CKPW5oGI69ZF5mdaMxRU/kdyidwkbK3oI63IR?= =?us-ascii?Q?ywIRYZXA3Y/NEqWDIZQDNFWYclSz5LEGYUDdYIbyGEVKXwMyu+t59NQWcRoB?= =?us-ascii?Q?yLPHLtKYEenFozW8PLmllaZ2DlSo0WSDOZQ8o0fibagXaXfxEHNeBfB4pP2W?= =?us-ascii?Q?MT6ig5sZMsB51m5b5dCJ7GgFYHOBu05w/2rXpA/x1wLUNmykO7R4X5w2f6iz?= =?us-ascii?Q?zLg3xhIDj6sbyGBTENqR09buqGGP4pBV+omh+SIJ+IT4/LAxcU6eZNJukVE4?= =?us-ascii?Q?hyB4iUZK+fg+sZIKi1gZLUo73nI8TRKxGdGpuDklBk1A/B2lTpsYg8iUplpo?= =?us-ascii?Q?DzVbv+NXDiLWuv1fKBnZlnwEB87pnR2RnxIsLl5ATN3YsP802/K54JmAAV5a?= =?us-ascii?Q?yW4Q03Z9Q38/HrczFzlrFRmMnJ7G4LRVPHkhQvWCVLO2xCG9/I3F9KTx2w7f?= =?us-ascii?Q?UOSjnMlx5TrqK4lE7uuhqZitSJ9pbyrHffRXXs7X5X/1GIB7nOPUXHi+z5uJ?= =?us-ascii?Q?VbT8lr1NW/ASqkzXPy5i4Qz7n8KlNGuM2L47dqZeG8vr+aiyFvFzElJ+L1QY?= =?us-ascii?Q?jtPgUkXCHu+NpGzDqBtOOdtTIzjcduylD7fh9VhG1TDMRtaDtE750ScWjnZ4?= =?us-ascii?Q?89V8rngU55hROo1cFf7JN2REPxEzzdwa/3uebL5wJVmxuR8IdMqB/MhkbDDf?= =?us-ascii?Q?Z7cYUCommGhYJgkovclShPdsUM+0AQyjPx+e+AcGV6l1yRmrCruvihqF2r+7?= =?us-ascii?Q?TkgDxVG/LfuPDZZMcA488+2RhVazXfdeM8KiM3QJWZpJyLmQgPM396UXb6Oq?= =?us-ascii?Q?LUWvYxtFMp5jfrQUBXPllPishjfUGwrehn6XE/siccjmFeWqhDuqvue58q+C?= =?us-ascii?Q?7G09zsSEiq1PklINSlNudbhHifqmq3iZdJjZkFDT4SIjNo903nqCaEsw2HjE?= =?us-ascii?Q?xMR50Ko5d8=3D?= X-Microsoft-Exchange-Diagnostics: 1; HE1PR08MB0843; 6:6vxrrEYzkstuUYNx9SdzRYOef5ijAmBl9r8vbHZ5coiEYRIrQlGXTket63v4VlPrWzML3uiK0ggQB+RiG8KLtSVJHqBf9GWsWR8KS7x/OXLxXZ/jx89XBdsm4e3d4QC/TNAwvAjEG8KvCsmQb1kRRcs6pAzq0wPRynkU8CX5wJ77L1KqIFJj6Kvs5DYKyRuauej0HfcSVXTUYR8xFw2txUwg5ndIgxUe4MDYgwkcGEJyqsjVEm3nCmCnqBZqkMZbHOovZF4paLEGMmYqmaZHW2ck++/SjYehqKJJWtz4b1s7V1XRsRAGK1FY8Rb4IPK7iBR+TJbCcfvTZEsTEJzNpjw2yGlxy1qkhg4wGZSr3EI=; 5:1ZFVYFHJ0BwD1LGnWLikHVR474XT9SI4isQIGWp0+GzlgQ4BGARFsLFSbQn6CFfRoA1A5oRTPHeyXsI8ZCB7V/cC5YAWL3R1+QM4DyijVYsrMuNYpNnuDxbevOs+gwMKCQN3kPiY1g6iMqrvJT6NoCZ8ubF1zpWReKsG++4kjjc=; 24:pScI2JxkcwWyTOZWO1yGpoxTjLHadhfHVp6elm9syeKxkUOdtyKj2lCIOAtzi9B3TBZm6JgVoEwS/jU7oUKsHq/20c+Ei739T3JOzXgzaA0=; 7:pimUozbib1pjG/zMmaXfRpsAedBqfqQePD2Cxdh+I2ZAHjcKV56udo64eoPCpQV19F98nXlw/Vkdty1dBDePUWFYDYqD/Ucbr9eQpD0C3AlCHJm6z5TdN2HxyR9nixPIowJ1KkPKOM94QQnpM4yfIn+Ro8AtfL34V0z0JD318xk/KeCwqzhujnv4ctzLTEXc3AG+hbTVpPD4OLuY3ll59HB1tb+qRXfNctS54EegtDAOFV0sI1knYr1tA2ClDWa2 SpamDiagnosticOutput: 1:99 SpamDiagnosticMetadata: NSPM X-Microsoft-Exchange-Diagnostics: 1; HE1PR08MB0843; 20:FAfEFKbn/ZMb1zH/WVGStYUdBGwua9cLSdFkWRfdBi31CpvKvIpoJylYkyV6slqJLWSx9gb/7wpnyd4nbwEZYrAGRwjKGkj2ylcQPlVr+4XYu2TKHywdRWWca17eKz0myeVfrbTiLB58dMgH3y+dxcRXs6rn6cP05HaNWn6fI+4= Sender: kvm-owner@vger.kernel.org Precedence: bulk

diff --git a/Documentation/virtual/kvm/api.txt b/Documentation/virtual/kvm/api.txt index 57d3ee9e4bde..3a959373fd97 100644 --- a/Documentation/virtual/kvm/api.txt +++ b/Documentation/virtual/kvm/api.txt @@ -3403,6 +3403,37 @@ invalid, if invalid pages are written to (e.g. after the end of memory) or if no page table is present for the addresses (e.g. when using hugepages). +4.109 KVM_HYPERV_EVENTFD + +Capability: KVM_CAP_HYPERV_EVENTFD +Architectures: x86 +Type: vm ioctl +Parameters: struct kvm_hyperv_eventfd (in) + +This ioctl (un)registers an eventfd to receive notifications from the guest on +the specified Hyper-V connection id through the SIGNAL_EVENT hypercall, without +causing a user exit. + +struct kvm_hyperv_eventfd { + __u32 conn_id; + __s32 fd; + __u32 flags; + __u32 padding[3]; +}; + +The conn_id field should fit within 24 bits: + +#define KVM_HYPERV_CONN_ID_MASK 0x00ffffff + +The acceptable values for the flags field are: + +#define KVM_HYPERV_EVENTFD_DEASSIGN (1 << 0) + +Returns: 0 on success, + -EINVAL if conn_id or flags is outside the allowed range + -ENOENT on deassign if the conn_id isn't registered + -EEXIST on assign if the conn_id is already registered + 5. The kvm_run structure ------------------------ diff --git a/arch/x86/include/asm/kvm_host.h b/arch/x86/include/asm/kvm_host.h index 516798431328..6a9914752a84 100644 --- a/arch/x86/include/asm/kvm_host.h +++ b/arch/x86/include/asm/kvm_host.h @@ -752,6 +752,8 @@ struct kvm_hv { u64 hv_crash_ctl; HV_REFERENCE_TSC_PAGE tsc_ref; + + struct idr conn_to_evt; }; enum kvm_irqchip_mode { diff --git a/arch/x86/kvm/hyperv.h b/arch/x86/kvm/hyperv.h index cc2468244ca2..837465d69c6d 100644 --- a/arch/x86/kvm/hyperv.h +++ b/arch/x86/kvm/hyperv.h @@ -90,5 +90,6 @@ void kvm_hv_setup_tsc_page(struct kvm *kvm, void kvm_hv_init_vm(struct kvm *kvm); void kvm_hv_destroy_vm(struct kvm *kvm); +int kvm_vm_ioctl_hv_eventfd(struct kvm *kvm, struct kvm_hyperv_eventfd *args); #endif diff --git a/include/uapi/linux/kvm.h b/include/uapi/linux/kvm.h index 496e59a2738b..7a871e7fb5df 100644 --- a/include/uapi/linux/kvm.h +++ b/include/uapi/linux/kvm.h @@ -932,6 +932,7 @@ struct kvm_ppc_resize_hpt { #define KVM_CAP_HYPERV_SYNIC2 148 #define KVM_CAP_HYPERV_VP_INDEX 149 #define KVM_CAP_S390_AIS_MIGRATION 150 +#define KVM_CAP_HYPERV_EVENTFD 151 #ifdef KVM_CAP_IRQ_ROUTING @@ -1359,6 +1360,8 @@ struct kvm_s390_ucas_mapping { #define KVM_S390_GET_CMMA_BITS _IOWR(KVMIO, 0xb8, struct kvm_s390_cmma_log) #define KVM_S390_SET_CMMA_BITS _IOW(KVMIO, 0xb9, struct kvm_s390_cmma_log) +#define KVM_HYPERV_EVENTFD _IOW(KVMIO, 0xba, struct kvm_hyperv_eventfd) + #define KVM_DEV_ASSIGN_ENABLE_IOMMU (1 << 0) #define KVM_DEV_ASSIGN_PCI_2_3 (1 << 1) #define KVM_DEV_ASSIGN_MASK_INTX (1 << 2) @@ -1419,4 +1422,14 @@ struct kvm_assigned_msix_entry { #define KVM_ARM_DEV_EL1_PTIMER (1 << 1) #define KVM_ARM_DEV_PMU (1 << 2) +struct kvm_hyperv_eventfd { + __u32 conn_id; + __s32 fd; + __u32 flags; + __u32 padding[3]; +}; + +#define KVM_HYPERV_CONN_ID_MASK 0x00ffffff +#define KVM_HYPERV_EVENTFD_DEASSIGN (1 << 0) + #endif /* __LINUX_KVM_H */ diff --git a/arch/x86/kvm/hyperv.c b/arch/x86/kvm/hyperv.c index 015fb06c7522..c1541dccf14d 100644 --- a/arch/x86/kvm/hyperv.c +++ b/arch/x86/kvm/hyperv.c @@ -29,6 +29,7 @@ #include <linux/kvm_host.h> #include <linux/highmem.h> #include <linux/sched/cputime.h> +#include <linux/eventfd.h> #include <asm/apicdef.h> #include <trace/events/kvm.h> @@ -1226,6 +1227,50 @@ static int kvm_hv_hypercall_complete_userspace(struct kvm_vcpu *vcpu) return 1; } +static u16 kvm_hvcall_signal_event(struct kvm_vcpu *vcpu, bool fast, u64 param) +{ + u16 ret; + u32 conn_id, flag_no; + int idx; + struct eventfd_ctx *eventfd; + + if (unlikely(!fast)) { + gpa_t gpa = param; + + if ((gpa & (__alignof__(param) - 1)) || + offset_in_page(gpa) + sizeof(param) > PAGE_SIZE) + return HV_STATUS_INVALID_ALIGNMENT; + + idx = srcu_read_lock(&vcpu->kvm->srcu); + ret = kvm_vcpu_read_guest(vcpu, gpa, &param, sizeof(param)); + srcu_read_unlock(&vcpu->kvm->srcu, idx); + + if (ret < 0) + return HV_STATUS_INSUFFICIENT_MEMORY; + } + + /* + * the signaled event number is made up of a 24bit "connection id" and + * a 16bit "flag number"; on the hypervisor side it's only their sum + * that matters + */ + conn_id = param; + flag_no = param >> 32; + if ((conn_id & ~KVM_HYPERV_CONN_ID_MASK) || (flag_no & 0xffff0000)) + return HV_STATUS_INVALID_CONNECTION_ID; + conn_id += flag_no; + if (conn_id & ~KVM_HYPERV_CONN_ID_MASK) + return HV_STATUS_INVALID_CONNECTION_ID; + + idx = srcu_read_lock(&vcpu->kvm->srcu); + eventfd = idr_find(&vcpu->kvm->arch.hyperv.conn_to_evt, conn_id); + if (eventfd) + eventfd_signal(eventfd, 1); + srcu_read_unlock(&vcpu->kvm->srcu, idx); + + return eventfd ? HV_STATUS_SUCCESS : HV_STATUS_INVALID_CONNECTION_ID; +} + int kvm_hv_hypercall(struct kvm_vcpu *vcpu) { u64 param, ingpa, outgpa, ret; @@ -1276,8 +1321,12 @@ int kvm_hv_hypercall(struct kvm_vcpu *vcpu) case HVCALL_NOTIFY_LONG_SPIN_WAIT: kvm_vcpu_on_spin(vcpu, true); break; - case HVCALL_POST_MESSAGE: case HVCALL_SIGNAL_EVENT: + res = kvm_hvcall_signal_event(vcpu, fast, ingpa); + if (res != HV_STATUS_INVALID_CONNECTION_ID) + break; + /* maybe userspace knows this conn_id: fall through */ + case HVCALL_POST_MESSAGE: /* don't bother userspace if it has no way to handle it */ if (!vcpu_to_synic(vcpu)->active) { res = HV_STATUS_INVALID_HYPERCALL_CODE; @@ -1305,8 +1354,67 @@ int kvm_hv_hypercall(struct kvm_vcpu *vcpu) void kvm_hv_init_vm(struct kvm *kvm) { mutex_init(&kvm->arch.hyperv.hv_lock); + idr_init(&kvm->arch.hyperv.conn_to_evt); } void kvm_hv_destroy_vm(struct kvm *kvm) { + struct eventfd_ctx *eventfd; + int i; + + idr_for_each_entry(&kvm->arch.hyperv.conn_to_evt, eventfd, i) + eventfd_ctx_put(eventfd); + idr_destroy(&kvm->arch.hyperv.conn_to_evt); +} + +static int kvm_hv_eventfd_assign(struct kvm *kvm, u32 conn_id, int fd) +{ + struct kvm_hv *hv = &kvm->arch.hyperv; + struct eventfd_ctx *eventfd; + int ret; + + eventfd = eventfd_ctx_fdget(fd); + if (IS_ERR(eventfd)) + return PTR_ERR(eventfd); + + mutex_lock(&hv->hv_lock); + ret = idr_alloc(&hv->conn_to_evt, eventfd, conn_id, conn_id + 1, + GFP_KERNEL); + mutex_unlock(&hv->hv_lock); + + if (ret >= 0) + return 0; + + if (ret == -ENOSPC) + ret = -EEXIST; + eventfd_ctx_put(eventfd); + return ret; +} + +static int kvm_hv_eventfd_deassign(struct kvm *kvm, u32 conn_id) +{ + struct kvm_hv *hv = &kvm->arch.hyperv; + struct eventfd_ctx *eventfd; + + mutex_lock(&hv->hv_lock); + eventfd = idr_remove(&hv->conn_to_evt, conn_id); + mutex_unlock(&hv->hv_lock); + + if (!eventfd) + return -ENOENT; + + synchronize_srcu(&kvm->srcu); + eventfd_ctx_put(eventfd); + return 0; +} + +int kvm_vm_ioctl_hv_eventfd(struct kvm *kvm, struct kvm_hyperv_eventfd *args) +{ + if ((args->flags & ~KVM_HYPERV_EVENTFD_DEASSIGN) || + (args->conn_id & ~KVM_HYPERV_CONN_ID_MASK)) + return -EINVAL; + + if (args->flags == KVM_HYPERV_EVENTFD_DEASSIGN) + return kvm_hv_eventfd_deassign(kvm, args->conn_id); + return kvm_hv_eventfd_assign(kvm, args->conn_id, args->fd); } diff --git a/arch/x86/kvm/x86.c b/arch/x86/kvm/x86.c index d17cf7900138..1c43d262da14 100644 --- a/arch/x86/kvm/x86.c +++ b/arch/x86/kvm/x86.c @@ -2701,6 +2701,7 @@ int kvm_vm_ioctl_check_extension(struct kvm *kvm, long ext) case KVM_CAP_HYPERV_SYNIC: case KVM_CAP_HYPERV_SYNIC2: case KVM_CAP_HYPERV_VP_INDEX: + case KVM_CAP_HYPERV_EVENTFD: case KVM_CAP_PCI_SEGMENT: case KVM_CAP_DEBUGREGS: case KVM_CAP_X86_ROBUST_SINGLESTEP: @@ -4295,6 +4296,15 @@ long kvm_arch_vm_ioctl(struct file *filp, r = kvm_vm_ioctl_enable_cap(kvm, &cap); break; } + case KVM_HYPERV_EVENTFD: { + struct kvm_hyperv_eventfd hvevfd; + + r = -EFAULT; + if (copy_from_user(&hvevfd, argp, sizeof(hvevfd))) + goto out; + r = kvm_vm_ioctl_hv_eventfd(kvm, &hvevfd); + break; + } default: r = -ENOTTY; }

[v5,2/2] kvm: x86: hyperv: guest->host event signaling via eventfd

Commit Message

Comments

Patch