Blame - arch/s390/mm/gup.c - kernel/msm-5.4

blob: 8ecc25e760fa6dfba0f082cfd8dff38b8c33d9e9 [file] [log] [blame]

Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	1	/*
				2	* Lockless get_user_pages_fast for s390
				3	*
				4	* Copyright IBM Corp. 2010
				5	* Author(s): Martin Schwidefsky <schwidefsky@de.ibm.com>
				6	*/
				7	#include <linux/sched.h>
				8	#include <linux/mm.h>
				9	#include <linux/hugetlb.h>
				10	#include <linux/vmstat.h>
				11	#include <linux/pagemap.h>
				12	#include <linux/rwsem.h>
				13	#include <asm/pgtable.h>
				14
				15	/*
				16	* The performance critical leaf functions are made noinline otherwise gcc
				17	* inlines everything into a single function which results in too much
				18	* register pressure.
				19	*/
				20	static inline int gup_pte_range(pmd_t *pmdp, pmd_t pmd, unsigned long addr,
				21	unsigned long end, int write, struct page *pages, int nr)
				22	{
Gerald Schaefer	fc897c9	2016-03-17 15:00:04 +0100	[diff] [blame]	23	struct page head, page;
Martin Schwidefsky	25591b0	2010-11-10 10:05:51 +0100	[diff] [blame]	24	unsigned long mask;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	25	pte_t *ptep, pte;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	26
Martin Schwidefsky	e509861	2013-07-23 20:57:57 +0200	[diff] [blame]	27	mask = (write ? _PAGE_PROTECT : 0) \| _PAGE_INVALID \| _PAGE_SPECIAL;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	28
				29	ptep = ((pte_t *) pmd_deref(pmd)) + pte_index(addr);
				30	do {
				31	pte = *ptep;
				32	barrier();
Gerald Schaefer	ecf46ab	2015-05-29 15:34:51 +0200	[diff] [blame]	33	/* Similar to the PMD case, NUMA hinting must take slow path */
				34	if (pte_protnone(pte))
				35	return 0;
Martin Schwidefsky	25591b0	2010-11-10 10:05:51 +0100	[diff] [blame]	36	if ((pte_val(pte) & mask) != 0)
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	37	return 0;
				38	VM_BUG_ON(!pfn_valid(pte_pfn(pte)));
				39	page = pte_page(pte);
Gerald Schaefer	fc897c9	2016-03-17 15:00:04 +0100	[diff] [blame]	40	head = compound_head(page);
				41	if (!page_cache_get_speculative(head))
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	42	return 0;
				43	if (unlikely(pte_val(pte) != pte_val(*ptep))) {
Gerald Schaefer	fc897c9	2016-03-17 15:00:04 +0100	[diff] [blame]	44	put_page(head);
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	45	return 0;
				46	}
Gerald Schaefer	fc897c9	2016-03-17 15:00:04 +0100	[diff] [blame]	47	VM_BUG_ON_PAGE(compound_head(page) != head, page);
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	48	pages[*nr] = page;
				49	(*nr)++;
				50
				51	} while (ptep++, addr += PAGE_SIZE, addr != end);
				52
				53	return 1;
				54	}
				55
				56	static inline int gup_huge_pmd(pmd_t *pmdp, pmd_t pmd, unsigned long addr,
				57	unsigned long end, int write, struct page *pages, int nr)
				58	{
				59	unsigned long mask, result;
Kirill A. Shutemov	ddc58f2	2016-01-15 16:52:56 -0800	[diff] [blame]	60	struct page head, page;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	61	int refs;
				62
Martin Schwidefsky	e509861	2013-07-23 20:57:57 +0200	[diff] [blame]	63	result = write ? 0 : _SEGMENT_ENTRY_PROTECT;
				64	mask = result \| _SEGMENT_ENTRY_INVALID;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	65	if ((pmd_val(pmd) & mask) != result)
				66	return 0;
				67	VM_BUG_ON(!pfn_valid(pmd_val(pmd) >> PAGE_SHIFT));
				68
				69	refs = 0;
				70	head = pmd_page(pmd);
				71	page = head + ((addr & ~PMD_MASK) >> PAGE_SHIFT);
				72	do {
				73	VM_BUG_ON(compound_head(page) != head);
				74	pages[*nr] = page;
				75	(*nr)++;
				76	page++;
				77	refs++;
				78	} while (addr += PAGE_SIZE, addr != end);
				79
				80	if (!page_cache_add_speculative(head, refs)) {
				81	*nr -= refs;
				82	return 0;
				83	}
				84
				85	if (unlikely(pmd_val(pmd) != pmd_val(*pmdp))) {
				86	*nr -= refs;
				87	while (refs--)
				88	put_page(head);
Andrea Arcangeli	0693bc9	2011-11-02 13:37:28 -0700	[diff] [blame]	89	return 0;
				90	}
				91
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	92	return 1;
				93	}
				94
				95
				96	static inline int gup_pmd_range(pud_t *pudp, pud_t pud, unsigned long addr,
				97	unsigned long end, int write, struct page *pages, int nr)
				98	{
				99	unsigned long next;
				100	pmd_t *pmdp, pmd;
				101
				102	pmdp = (pmd_t *) pudp;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	103	if ((pud_val(pud) & _REGION_ENTRY_TYPE_MASK) == _REGION_ENTRY_TYPE_R3)
				104	pmdp = (pmd_t *) pud_deref(pud);
				105	pmdp += pmd_index(addr);
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	106	do {
				107	pmd = *pmdp;
				108	barrier();
				109	next = pmd_addr_end(addr, end);
Kirill A. Shutemov	fecffad	2016-01-15 16:53:24 -0800	[diff] [blame]	110	if (pmd_none(pmd))
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	111	return 0;
Gerald Schaefer	156152f	2012-10-25 17:24:12 +0200	[diff] [blame]	112	if (unlikely(pmd_large(pmd))) {
Gerald Schaefer	ecf46ab	2015-05-29 15:34:51 +0200	[diff] [blame]	113	/*
				114	* NUMA hinting faults need to be handled in the GUP
				115	* slowpath for accounting purposes and so that they
				116	* can be serialised against THP migration.
				117	*/
				118	if (pmd_protnone(pmd))
				119	return 0;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	120	if (!gup_huge_pmd(pmdp, pmd, addr, next,
				121	write, pages, nr))
				122	return 0;
				123	} else if (!gup_pte_range(pmdp, pmd, addr, next,
				124	write, pages, nr))
				125	return 0;
				126	} while (pmdp++, addr = next, addr != end);
				127
				128	return 1;
				129	}
				130
Gerald Schaefer	d08de8e	2016-07-04 14:47:01 +0200	[diff] [blame]	131	static int gup_huge_pud(pud_t *pudp, pud_t pud, unsigned long addr,
				132	unsigned long end, int write, struct page *pages, int nr)
				133	{
				134	struct page head, page;
				135	unsigned long mask;
				136	int refs;
				137
				138	mask = (write ? _REGION_ENTRY_PROTECT : 0) \| _REGION_ENTRY_INVALID;
				139	if ((pud_val(pud) & mask) != 0)
				140	return 0;
				141	VM_BUG_ON(!pfn_valid(pud_pfn(pud)));
				142
				143	refs = 0;
				144	head = pud_page(pud);
				145	page = head + ((addr & ~PUD_MASK) >> PAGE_SHIFT);
				146	do {
				147	VM_BUG_ON_PAGE(compound_head(page) != head, page);
				148	pages[*nr] = page;
				149	(*nr)++;
				150	page++;
				151	refs++;
				152	} while (addr += PAGE_SIZE, addr != end);
				153
				154	if (!page_cache_add_speculative(head, refs)) {
				155	*nr -= refs;
				156	return 0;
				157	}
				158
				159	if (unlikely(pud_val(pud) != pud_val(*pudp))) {
				160	*nr -= refs;
				161	while (refs--)
				162	put_page(head);
				163	return 0;
				164	}
				165
				166	return 1;
				167	}
				168
Martin Schwidefsky	1aea9b3	2017-04-24 18:19:10 +0200	[diff] [blame]	169	static inline int gup_pud_range(p4d_t *p4dp, p4d_t p4d, unsigned long addr,
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	170	unsigned long end, int write, struct page *pages, int nr)
				171	{
				172	unsigned long next;
				173	pud_t *pudp, pud;
				174
Martin Schwidefsky	1aea9b3	2017-04-24 18:19:10 +0200	[diff] [blame]	175	pudp = (pud_t *) p4dp;
				176	if ((p4d_val(p4d) & _REGION_ENTRY_TYPE_MASK) == _REGION_ENTRY_TYPE_R2)
				177	pudp = (pud_t *) p4d_deref(p4d);
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	178	pudp += pud_index(addr);
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	179	do {
				180	pud = *pudp;
				181	barrier();
				182	next = pud_addr_end(addr, end);
				183	if (pud_none(pud))
				184	return 0;
Gerald Schaefer	d08de8e	2016-07-04 14:47:01 +0200	[diff] [blame]	185	if (unlikely(pud_large(pud))) {
				186	if (!gup_huge_pud(pudp, pud, addr, next, write, pages,
				187	nr))
				188	return 0;
				189	} else if (!gup_pmd_range(pudp, pud, addr, next, write, pages,
				190	nr))
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	191	return 0;
				192	} while (pudp++, addr = next, addr != end);
				193
				194	return 1;
				195	}
				196
Martin Schwidefsky	1aea9b3	2017-04-24 18:19:10 +0200	[diff] [blame]	197	static inline int gup_p4d_range(pgd_t *pgdp, pgd_t pgd, unsigned long addr,
				198	unsigned long end, int write, struct page *pages, int nr)
				199	{
				200	unsigned long next;
				201	p4d_t *p4dp, p4d;
				202
				203	p4dp = (p4d_t *) pgdp;
				204	if ((pgd_val(pgd) & _REGION_ENTRY_TYPE_MASK) == _REGION_ENTRY_TYPE_R1)
				205	p4dp = (p4d_t *) pgd_deref(pgd);
				206	p4dp += p4d_index(addr);
				207	do {
				208	p4d = *p4dp;
				209	barrier();
				210	next = p4d_addr_end(addr, end);
				211	if (p4d_none(p4d))
				212	return 0;
				213	if (!gup_pud_range(p4dp, p4d, addr, next, write, pages, nr))
				214	return 0;
				215	} while (p4dp++, addr = next, addr != end);
				216
				217	return 1;
				218	}
				219
Gerald Schaefer	34cda99	2012-09-04 15:37:55 +0200	[diff] [blame]	220	/*
				221	* Like get_user_pages_fast() except its IRQ-safe in that it won't fall
				222	* back to the regular GUP.
				223	*/
				224	int __get_user_pages_fast(unsigned long start, int nr_pages, int write,
				225	struct page **pages)
				226	{
				227	struct mm_struct *mm = current->mm;
				228	unsigned long addr, len, end;
				229	unsigned long next, flags;
				230	pgd_t *pgdp, pgd;
				231	int nr = 0;
				232
				233	start &= PAGE_MASK;
				234	addr = start;
				235	len = (unsigned long) nr_pages << PAGE_SHIFT;
				236	end = start + len;
Martin Schwidefsky	ee71d16	2017-04-20 14:43:51 +0200	[diff] [blame]	237	if ((end <= start) \|\| (end > mm->context.asce_limit))
Gerald Schaefer	34cda99	2012-09-04 15:37:55 +0200	[diff] [blame]	238	return 0;
Heiko Carstens	01997bb	2013-10-07 16:14:50 +0200	[diff] [blame]	239	/*
				240	* local_irq_save() doesn't prevent pagetable teardown, but does
				241	* prevent the pagetables from being freed on s390.
				242	*
				243	* So long as we atomically load page table pointers versus teardown,
				244	* we can follow the address down to the the page and take a ref on it.
				245	*/
Gerald Schaefer	34cda99	2012-09-04 15:37:55 +0200	[diff] [blame]	246	local_irq_save(flags);
				247	pgdp = pgd_offset(mm, addr);
				248	do {
				249	pgd = *pgdp;
				250	barrier();
				251	next = pgd_addr_end(addr, end);
				252	if (pgd_none(pgd))
				253	break;
Martin Schwidefsky	1aea9b3	2017-04-24 18:19:10 +0200	[diff] [blame]	254	if (!gup_p4d_range(pgdp, pgd, addr, next, write, pages, &nr))
Gerald Schaefer	34cda99	2012-09-04 15:37:55 +0200	[diff] [blame]	255	break;
				256	} while (pgdp++, addr = next, addr != end);
				257	local_irq_restore(flags);
				258
				259	return nr;
				260	}
				261
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	262	/**
				263	* get_user_pages_fast() - pin user pages in memory
				264	* @start: starting user address
				265	* @nr_pages: number of pages from start to pin
				266	* @write: whether pages will be written to
				267	* @pages: array that receives pointers to the pages pinned.
				268	* Should be at least nr_pages long.
				269	*
				270	* Attempt to pin user pages in memory without taking mm->mmap_sem.
				271	* If not successful, it will fall back to taking the lock and
				272	* calling get_user_pages().
				273	*
				274	* Returns number of pages pinned. This may be fewer than the number
				275	* requested. If nr_pages is 0 or negative, returns 0. If no pages
				276	* were pinned, returns -errno.
				277	*/
				278	int get_user_pages_fast(unsigned long start, int nr_pages, int write,
				279	struct page **pages)
				280	{
Heiko Carstens	01997bb	2013-10-07 16:14:50 +0200	[diff] [blame]	281	int nr, ret;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	282
David Hildenbrand	40612351	2015-10-15 10:47:18 +0200	[diff] [blame]	283	might_sleep();
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	284	start &= PAGE_MASK;
Heiko Carstens	01997bb	2013-10-07 16:14:50 +0200	[diff] [blame]	285	nr = __get_user_pages_fast(start, nr_pages, write, pages);
				286	if (nr == nr_pages)
				287	return nr;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	288
Heiko Carstens	01997bb	2013-10-07 16:14:50 +0200	[diff] [blame]	289	/* Try to get the remaining pages with get_user_pages */
				290	start += nr << PAGE_SHIFT;
				291	pages += nr;
Lorenzo Stoakes	c164154	2016-10-13 01:20:13 +0100	[diff] [blame]	292	ret = get_user_pages_unlocked(start, nr_pages - nr, pages,
				293	write ? FOLL_WRITE : 0);
Heiko Carstens	01997bb	2013-10-07 16:14:50 +0200	[diff] [blame]	294	/* Have to be a bit careful with return values */
				295	if (nr > 0)
				296	ret = (ret < 0) ? nr : ret + nr;
				297	return ret;
Martin Schwidefsky	8021714	2010-10-25 16:10:11 +0200	[diff] [blame]	298	}