Blame - drivers/staging/lustre/lustre/llite/rw26.c - kernel/msm-4.9

blob: 26f3a37873a75ceae43a80220f8938606224786d [file] [log] [blame]

Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	1	/*
				2	* GPL HEADER START
				3	*
				4	* DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.
				5	*
				6	* This program is free software; you can redistribute it and/or modify
				7	* it under the terms of the GNU General Public License version 2 only,
				8	* as published by the Free Software Foundation.
				9	*
				10	* This program is distributed in the hope that it will be useful, but
				11	* WITHOUT ANY WARRANTY; without even the implied warranty of
				12	* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
				13	* General Public License version 2 for more details (a copy is included
				14	* in the LICENSE file that accompanied this code).
				15	*
				16	* You should have received a copy of the GNU General Public License
				17	* version 2 along with this program; If not, see
Oleg Drokin	6a5b99a	2016-06-14 23:33:40 -0400	[diff] [blame]	18	* http://www.gnu.org/licenses/gpl-2.0.html
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	19	*
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	20	* GPL HEADER END
				21	*/
				22	/*
				23	* Copyright (c) 2003, 2010, Oracle and/or its affiliates. All rights reserved.
				24	* Use is subject to license terms.
				25	*
				26	* Copyright (c) 2011, 2012, Intel Corporation.
				27	*/
				28	/*
				29	* This file is part of Lustre, http://www.lustre.org/
				30	* Lustre is a trademark of Sun Microsystems, Inc.
				31	*
				32	* lustre/lustre/llite/rw26.c
				33	*
				34	* Lustre Lite I/O page cache routines for the 2.5/2.6 kernel version
				35	*/
				36
				37	#include <linux/kernel.h>
				38	#include <linux/mm.h>
				39	#include <linux/string.h>
				40	#include <linux/stat.h>
				41	#include <linux/errno.h>
				42	#include <linux/unistd.h>
Georges-Axel Jaloyan	9fb186c	2015-04-02 16:10:31 +0200	[diff] [blame]	43	#include <linux/uaccess.h>
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	44
				45	#include <linux/migrate.h>
				46	#include <linux/fs.h>
				47	#include <linux/buffer_head.h>
				48	#include <linux/mpage.h>
				49	#include <linux/writeback.h>
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	50	#include <linux/pagemap.h>
				51
				52	#define DEBUG_SUBSYSTEM S_LLITE
				53
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	54	#include "llite_internal.h"
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	55
				56	/**
				57	* Implements Linux VM address_space::invalidatepage() method. This method is
				58	* called when the page is truncate from a file, either as a result of
				59	* explicit truncate, or when inode is removed from memory (as a result of
				60	* final iput(), umount, or memory pressure induced icache shrinking).
				61	*
				62	* [0, offset] bytes of the page remain valid (this is for a case of not-page
				63	* aligned truncate). Lustre leaves partially truncated page in the cache,
				64	* relying on struct inode::i_size to limit further accesses.
				65	*/
Stephen Rothwell	5237c44	2013-07-15 22:27:17 +0800	[diff] [blame]	66	static void ll_invalidatepage(struct page *vmpage, unsigned int offset,
				67	unsigned int length)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	68	{
				69	struct inode *inode;
				70	struct lu_env *env;
				71	struct cl_page *page;
				72	struct cl_object *obj;
				73
				74	int refcheck;
				75
				76	LASSERT(PageLocked(vmpage));
				77	LASSERT(!PageWriteback(vmpage));
				78
				79	/*
				80	* It is safe to not check anything in invalidatepage/releasepage
				81	* below because they are run with page locked and all our io is
				82	* happening with locked page too
				83	*/
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	84	if (offset == 0 && length == PAGE_SIZE) {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	85	env = cl_env_get(&refcheck);
				86	if (!IS_ERR(env)) {
				87	inode = vmpage->mapping->host;
				88	obj = ll_i2info(inode)->lli_clob;
Oleg Drokin	6e16818	2016-02-16 00:46:46 -0500	[diff] [blame]	89	if (obj) {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	90	page = cl_vmpage_page(vmpage, obj);
Oleg Drokin	6e16818	2016-02-16 00:46:46 -0500	[diff] [blame]	91	if (page) {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	92	cl_page_delete(env, page);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	93	cl_page_put(env, page);
				94	}
Oleg Drokin	da5ecb4	2016-04-01 15:18:01 -0400	[diff] [blame]	95	} else {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	96	LASSERT(vmpage->private == 0);
Oleg Drokin	da5ecb4	2016-04-01 15:18:01 -0400	[diff] [blame]	97	}
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	98	cl_env_put(env, &refcheck);
				99	}
				100	}
				101	}
				102
Oleg Drokin	46f93a1	2016-02-26 01:50:00 -0500	[diff] [blame]	103	static int ll_releasepage(struct page *vmpage, gfp_t gfp_mask)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	104	{
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	105	struct lu_env *env;
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	106	void *cookie;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	107	struct cl_object *obj;
				108	struct cl_page *page;
				109	struct address_space *mapping;
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	110	int result = 0;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	111
				112	LASSERT(PageLocked(vmpage));
				113	if (PageWriteback(vmpage) \|\| PageDirty(vmpage))
				114	return 0;
				115
				116	mapping = vmpage->mapping;
Oleg Drokin	6e16818	2016-02-16 00:46:46 -0500	[diff] [blame]	117	if (!mapping)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	118	return 1;
				119
				120	obj = ll_i2info(mapping->host)->lli_clob;
Oleg Drokin	6e16818	2016-02-16 00:46:46 -0500	[diff] [blame]	121	if (!obj)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	122	return 1;
				123
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	124	/* 1 for caller, 1 for cl_page and 1 for page cache */
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	125	if (page_count(vmpage) > 3)
				126	return 0;
				127
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	128	page = cl_vmpage_page(vmpage, obj);
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	129	if (!page)
				130	return 1;
				131
				132	cookie = cl_env_reenter();
				133	env = cl_env_percpu_get();
				134	LASSERT(!IS_ERR(env));
				135
				136	if (!cl_page_in_use(page)) {
				137	result = 1;
				138	cl_page_delete(env, page);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	139	}
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	140
				141	/* To use percpu env array, the call path can not be rescheduled;
				142	* otherwise percpu array will be messed if ll_releaspage() called
				143	* again on the same CPU.
				144	*
				145	* If this page holds the last refc of cl_object, the following
				146	* call path may cause reschedule:
				147	* cl_page_put -> cl_page_free -> cl_object_put ->
Jinshan Xiong	06563b5	2016-03-30 19:48:40 -0400	[diff] [blame]	148	* lu_object_put -> lu_object_free -> lov_delete_raid0.
Jinshan Xiong	3c361c1	2016-03-30 19:48:29 -0400	[diff] [blame]	149	*
				150	* However, the kernel can't get rid of this inode until all pages have
				151	* been cleaned up. Now that we hold page lock here, it's pretty safe
				152	* that we won't get into object delete path.
				153	*/
				154	LASSERT(cl_object_refc(obj) > 1);
				155	cl_page_put(env, page);
				156
				157	cl_env_percpu_put(env);
				158	cl_env_reexit(cookie);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	159	return result;
				160	}
				161
Oleg Drokin	cd94f23	2016-08-21 18:04:34 -0400	[diff] [blame]	162	#define MAX_DIRECTIO_SIZE (2 * 1024 * 1024 * 1024UL)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	163
				164	static inline int ll_get_user_pages(int rw, unsigned long user_addr,
				165	size_t size, struct page ***pages,
				166	int *max_pages)
				167	{
				168	int result = -ENOMEM;
				169
				170	/* set an arbitrary limit to prevent arithmetic overflow */
				171	if (size > MAX_DIRECTIO_SIZE) {
				172	*pages = NULL;
				173	return -EFBIG;
				174	}
				175
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	176	*max_pages = (user_addr + size + PAGE_SIZE - 1) >> PAGE_SHIFT;
				177	*max_pages -= user_addr >> PAGE_SHIFT;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	178
Julia Lawall	e958f49	2015-06-11 14:02:52 +0200	[diff] [blame]	179	pages = libcfs_kvzalloc(max_pages * sizeof(**pages), GFP_NOFS);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	180	if (*pages) {
Jan Kara	d1a168e	2013-10-02 16:27:51 +0200	[diff] [blame]	181	result = get_user_pages_fast(user_addr, *max_pages,
				182	(rw == READ), *pages);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	183	if (unlikely(result <= 0))
Julia Lawall	e958f49	2015-06-11 14:02:52 +0200	[diff] [blame]	184	kvfree(*pages);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	185	}
				186
				187	return result;
				188	}
				189
				190	/* ll_free_user_pages - tear down page struct array
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	191	* @pages: array of page struct pointers underlying target buffer
				192	*/
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	193	static void ll_free_user_pages(struct page **pages, int npages, int do_dirty)
				194	{
				195	int i;
				196
				197	for (i = 0; i < npages; i++) {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	198	if (do_dirty)
				199	set_page_dirty_lock(pages[i]);
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	200	put_page(pages[i]);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	201	}
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	202	kvfree(pages);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	203	}
				204
				205	ssize_t ll_direct_rw_pages(const struct lu_env env, struct cl_io io,
				206	int rw, struct inode *inode,
				207	struct ll_dio_pages *pv)
				208	{
				209	struct cl_page *clp;
				210	struct cl_2queue *queue;
				211	struct cl_object *obj = io->ci_obj;
				212	int i;
				213	ssize_t rc = 0;
				214	loff_t file_offset = pv->ldp_start_offset;
Dmitry Eremin	fdeb14f	2016-09-18 16:38:29 -0400	[diff] [blame]	215	size_t size = pv->ldp_size;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	216	int page_count = pv->ldp_nr;
				217	struct page **pages = pv->ldp_pages;
Dmitry Eremin	fdeb14f	2016-09-18 16:38:29 -0400	[diff] [blame]	218	size_t page_size = cl_page_size(obj);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	219	bool do_io;
				220	int io_pages = 0;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	221
				222	queue = &io->ci_queue;
				223	cl_2queue_init(queue);
				224	for (i = 0; i < page_count; i++) {
				225	if (pv->ldp_offsets)
Oleg Drokin	defa220	2016-02-24 22:00:39 -0500	[diff] [blame]	226	file_offset = pv->ldp_offsets[i];
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	227
				228	LASSERT(!(file_offset & (page_size - 1)));
				229	clp = cl_page_find(env, obj, cl_index(obj, file_offset),
				230	pv->ldp_pages[i], CPT_TRANSIENT);
				231	if (IS_ERR(clp)) {
				232	rc = PTR_ERR(clp);
				233	break;
				234	}
				235
				236	rc = cl_page_own(env, io, clp);
				237	if (rc) {
				238	LASSERT(clp->cp_state == CPS_FREEING);
				239	cl_page_put(env, clp);
				240	break;
				241	}
				242
				243	do_io = true;
				244
				245	/* check the page type: if the page is a host page, then do
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	246	* write directly
				247	*/
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	248	if (clp->cp_type == CPT_CACHEABLE) {
Jinshan Xiong	7addf40	2016-03-30 19:48:32 -0400	[diff] [blame]	249	struct page *vmpage = cl_page_vmpage(clp);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	250	struct page *src_page;
				251	struct page *dst_page;
				252	void *src;
				253	void *dst;
				254
				255	src_page = (rw == WRITE) ? pages[i] : vmpage;
				256	dst_page = (rw == WRITE) ? vmpage : pages[i];
				257
Zhao Hongjiang	5e8ebf1	2013-07-08 17:06:14 +0800	[diff] [blame]	258	src = kmap_atomic(src_page);
				259	dst = kmap_atomic(dst_page);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	260	memcpy(dst, src, min(page_size, size));
Zhao Hongjiang	5e8ebf1	2013-07-08 17:06:14 +0800	[diff] [blame]	261	kunmap_atomic(dst);
				262	kunmap_atomic(src);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	263
				264	/* make sure page will be added to the transfer by
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	265	* cl_io_submit()->...->vvp_page_prep_write().
				266	*/
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	267	if (rw == WRITE)
				268	set_page_dirty(vmpage);
				269
				270	if (rw == READ) {
				271	/* do not issue the page for read, since it
				272	* may reread a ra page which has NOT uptodate
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	273	* bit set.
				274	*/
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	275	cl_page_disown(env, io, clp);
				276	do_io = false;
				277	}
				278	}
				279
				280	if (likely(do_io)) {
Shivani Bhardwaj	53f1a12	2015-11-11 15:43:28 +0530	[diff] [blame]	281	/*
				282	* Add a page to the incoming page list of 2-queue.
				283	*/
				284	cl_page_list_add(&queue->c2_qin, clp);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	285
				286	/*
				287	* Set page clip to tell transfer formation engine
				288	* that page has to be sent even if it is beyond KMS.
				289	*/
				290	cl_page_clip(env, clp, 0, min(size, page_size));
				291
				292	++io_pages;
				293	}
				294
				295	/* drop the reference count for cl_page_find */
				296	cl_page_put(env, clp);
				297	size -= page_size;
				298	file_offset += page_size;
				299	}
				300
				301	if (rc == 0 && io_pages) {
				302	rc = cl_io_submit_sync(env, io,
				303	rw == READ ? CRT_READ : CRT_WRITE,
				304	queue, 0);
				305	}
				306	if (rc == 0)
				307	rc = pv->ldp_size;
				308
				309	cl_2queue_discard(env, io, queue);
				310	cl_2queue_disown(env, io, queue);
				311	cl_2queue_fini(env, queue);
Greg Kroah-Hartman	0a3bdb0	2013-08-03 10:35:28 +0800	[diff] [blame]	312	return rc;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	313	}
				314	EXPORT_SYMBOL(ll_direct_rw_pages);
				315
				316	static ssize_t ll_direct_IO_26_seg(const struct lu_env env, struct cl_io io,
				317	int rw, struct inode *inode,
				318	struct address_space *mapping,
				319	size_t size, loff_t file_offset,
				320	struct page **pages, int page_count)
				321	{
Oleg Drokin	22ea97f	2016-02-26 01:50:10 -0500	[diff] [blame]	322	struct ll_dio_pages pvec = {
				323	.ldp_pages = pages,
				324	.ldp_nr = page_count,
				325	.ldp_size = size,
				326	.ldp_offsets = NULL,
				327	.ldp_start_offset = file_offset
				328	};
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	329
Oleg Drokin	22ea97f	2016-02-26 01:50:10 -0500	[diff] [blame]	330	return ll_direct_rw_pages(env, io, rw, inode, &pvec);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	331	}
				332
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	333	/* This is the maximum size of a single O_DIRECT request, based on the
				334	* kmalloc limit. We need to fit all of the brw_page structs, each one
				335	* representing PAGE_SIZE worth of user data, into a single buffer, and
				336	* then truncate this to be a full-sized RPC. For 4kB PAGE_SIZE this is
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	337	* up to 22MB for 128kB kmalloc and up to 682MB for 4MB kmalloc.
				338	*/
Oleg Drokin	12a880b	2016-02-26 01:50:11 -0500	[diff] [blame]	339	#define MAX_DIO_SIZE ((KMALLOC_MAX_SIZE / sizeof(struct brw_page) * \
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	340	PAGE_SIZE) & ~(DT_MAX_BRW_SIZE - 1))
Christoph Hellwig	c8b8e32	2016-04-07 08:51:58 -0700	[diff] [blame]	341	static ssize_t ll_direct_IO_26(struct kiocb iocb, struct iov_iter iter)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	342	{
				343	struct lu_env *env;
				344	struct cl_io *io;
				345	struct file *file = iocb->ki_filp;
				346	struct inode *inode = file->f_mapping->host;
Christoph Hellwig	c8b8e32	2016-04-07 08:51:58 -0700	[diff] [blame]	347	loff_t file_offset = iocb->ki_pos;
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	348	ssize_t count = iov_iter_count(iter);
				349	ssize_t tot_bytes = 0, result = 0;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	350	struct ll_inode_info *lli = ll_i2info(inode);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	351	long size = MAX_DIO_SIZE;
				352	int refcheck;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	353
				354	if (!lli->lli_has_smd)
Greg Kroah-Hartman	0a3bdb0	2013-08-03 10:35:28 +0800	[diff] [blame]	355	return -EBADF;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	356
				357	/* FIXME: io smaller than PAGE_SIZE is broken on ia64 ??? */
Oleg Drokin	616387e	2016-03-30 19:48:23 -0400	[diff] [blame]	358	if ((file_offset & ~PAGE_MASK) \|\| (count & ~PAGE_MASK))
Greg Kroah-Hartman	0a3bdb0	2013-08-03 10:35:28 +0800	[diff] [blame]	359	return -EINVAL;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	360
James Nunez	97a075c	2016-04-27 18:21:01 -0400	[diff] [blame]	361	CDEBUG(D_VFSTRACE, "VFS Op:inode="DFID"(%p), size=%zd (max %lu), offset=%lld=%llx, pages %zd (max %lu)\n",
				362	PFID(ll_inode2fid(inode)), inode, count, MAX_DIO_SIZE,
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	363	file_offset, file_offset, count >> PAGE_SHIFT,
				364	MAX_DIO_SIZE >> PAGE_SHIFT);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	365
				366	/* Check that all user buffers are aligned as well */
Oleg Drokin	616387e	2016-03-30 19:48:23 -0400	[diff] [blame]	367	if (iov_iter_alignment(iter) & ~PAGE_MASK)
Al Viro	886a391	2014-03-05 13:50:45 -0500	[diff] [blame]	368	return -EINVAL;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	369
				370	env = cl_env_get(&refcheck);
				371	LASSERT(!IS_ERR(env));
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	372	io = vvp_env_io(env)->vui_cl.cis_io;
Oleg Drokin	6e16818	2016-02-16 00:46:46 -0500	[diff] [blame]	373	LASSERT(io);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	374
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	375	while (iov_iter_count(iter)) {
				376	struct page **pages;
				377	size_t offs;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	378
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	379	count = min_t(size_t, iov_iter_count(iter), size);
Omar Sandoval	6f67376	2015-03-16 04:33:52 -0700	[diff] [blame]	380	if (iov_iter_rw(iter) == READ) {
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	381	if (file_offset >= i_size_read(inode))
				382	break;
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	383	if (file_offset + count > i_size_read(inode))
				384	count = i_size_read(inode) - file_offset;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	385	}
				386
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	387	result = iov_iter_get_pages_alloc(iter, &pages, count, &offs);
				388	if (likely(result > 0)) {
Tapasweni Pathak	ef96fdd	2014-10-08 22:56:44 +0530	[diff] [blame]	389	int n = DIV_ROUND_UP(result + offs, PAGE_SIZE);
Mike Rapoport	50ffcb7	2015-10-13 16:03:40 +0300	[diff] [blame]	390
Omar Sandoval	6f67376	2015-03-16 04:33:52 -0700	[diff] [blame]	391	result = ll_direct_IO_26_seg(env, io, iov_iter_rw(iter),
				392	inode, file->f_mapping,
				393	result, file_offset, pages,
				394	n);
				395	ll_free_user_pages(pages, n, iov_iter_rw(iter) == READ);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	396	}
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	397	if (unlikely(result <= 0)) {
				398	/* If we can't allocate a large enough buffer
				399	* for the request, shrink it to a smaller
				400	* PAGE_SIZE multiple and try again.
				401	* We should always be able to kmalloc for a
Oleg Drokin	c0894c6	2016-02-24 22:00:30 -0500	[diff] [blame]	402	* page worth of page pointers = 4MB on i386.
				403	*/
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	404	if (result == -ENOMEM &&
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	405	size > (PAGE_SIZE / sizeof(pages))
				406	PAGE_SIZE) {
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	407	size = ((((size / 2) - 1) \|
Oleg Drokin	616387e	2016-03-30 19:48:23 -0400	[diff] [blame]	408	~PAGE_MASK) + 1) &
				409	PAGE_MASK;
Greg Donald	1d8cb70	2014-08-25 20:07:19 -0500	[diff] [blame]	410	CDEBUG(D_VFSTRACE, "DIO size now %lu\n",
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	411	size);
				412	continue;
				413	}
				414
Julia Lawall	34e1f2b	2014-08-30 16:24:55 +0200	[diff] [blame]	415	goto out;
Al Viro	91f79c4	2014-03-21 04:58:33 -0400	[diff] [blame]	416	}
				417	iov_iter_advance(iter, result);
				418	tot_bytes += result;
				419	file_offset += result;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	420	}
				421	out:
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	422	if (tot_bytes > 0) {
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	423	struct vvp_io *vio = vvp_env_io(env);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	424
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	425	/* no commit async for direct IO */
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	426	vio->u.write.vui_written += tot_bytes;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	427	}
				428
				429	cl_env_put(env, &refcheck);
Dmitry Eremin	1b3f4f9	2016-04-27 21:37:21 -0400	[diff] [blame]	430	return tot_bytes ? tot_bytes : result;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	431	}
				432
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	433	/**
				434	* Prepare partially written-to page for a write.
				435	*/
				436	static int ll_prepare_partial_page(const struct lu_env env, struct cl_io io,
				437	struct cl_page *pg)
				438	{
John Hammond	9acc450	2016-03-30 19:48:57 -0400	[diff] [blame]	439	struct cl_attr *attr = vvp_env_thread_attr(env);
Jinshan Xiong	7addf40	2016-03-30 19:48:32 -0400	[diff] [blame]	440	struct cl_object *obj = io->ci_obj;
John L. Hammond	3a52f80	2016-03-30 19:48:48 -0400	[diff] [blame]	441	struct vvp_page *vpg = cl_object_page_slice(obj, pg);
				442	loff_t offset = cl_offset(obj, vvp_index(vpg));
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	443	int result;
				444
				445	cl_object_attr_lock(obj);
				446	result = cl_object_attr_get(env, obj, attr);
				447	cl_object_attr_unlock(obj);
				448	if (result == 0) {
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	449	/*
				450	* If are writing to a new page, no need to read old data.
				451	* The extent locking will have updated the KMS, and for our
				452	* purposes here we can treat it like i_size.
				453	*/
				454	if (attr->cat_kms <= offset) {
John L. Hammond	3a52f80	2016-03-30 19:48:48 -0400	[diff] [blame]	455	char *kaddr = kmap_atomic(vpg->vpg_page);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	456
				457	memset(kaddr, 0, cl_page_size(obj));
				458	kunmap_atomic(kaddr);
John L. Hammond	3a52f80	2016-03-30 19:48:48 -0400	[diff] [blame]	459	} else if (vpg->vpg_defer_uptodate) {
				460	vpg->vpg_ra_used = 1;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	461	} else {
				462	result = ll_page_sync_io(env, io, pg, CRT_READ);
				463	}
				464	}
				465	return result;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	466	}
				467
				468	static int ll_write_begin(struct file file, struct address_space mapping,
Oleg Drokin	e15ba45	2016-02-26 01:49:49 -0500	[diff] [blame]	469	loff_t pos, unsigned len, unsigned flags,
				470	struct page pagep, void fsdata)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	471	{
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	472	struct ll_cl_context *lcc;
Jinshan Xiong	966c4a8	2016-06-05 23:28:51 -0400	[diff] [blame]	473	const struct lu_env *env;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	474	struct cl_io *io;
				475	struct cl_page *page;
				476	struct cl_object *clob = ll_i2info(mapping->host)->lli_clob;
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	477	pgoff_t index = pos >> PAGE_SHIFT;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	478	struct page *vmpage = NULL;
Greg Kroah-Hartman	5f47992	2016-04-11 09:30:50 -0700	[diff] [blame]	479	unsigned int from = pos & (PAGE_SIZE - 1);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	480	unsigned int to = from + len;
				481	int result = 0;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	482
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	483	CDEBUG(D_VFSTRACE, "Writing %lu of %d to %d bytes\n", index, from, len);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	484
Jinshan Xiong	966c4a8	2016-06-05 23:28:51 -0400	[diff] [blame]	485	lcc = ll_cl_find(file);
				486	if (!lcc) {
				487	result = -EIO;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	488	goto out;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	489	}
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	490
				491	env = lcc->lcc_env;
				492	io = lcc->lcc_io;
				493
Jinshan Xiong	297e908	2016-08-16 16:18:58 -0400	[diff] [blame]	494	/* To avoid deadlock, try to lock page first. */
				495	vmpage = grab_cache_page_nowait(mapping, index);
Jinshan Xiong	d37dd10	2016-03-30 19:48:43 -0400	[diff] [blame]	496	if (unlikely(!vmpage \|\| PageDirty(vmpage) \|\| PageWriteback(vmpage))) {
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	497	struct vvp_io *vio = vvp_env_io(env);
				498	struct cl_page_list *plist = &vio->u.write.vui_queue;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	499
				500	/* if the page is already in dirty cache, we have to commit
				501	* the pages right now; otherwise, it may cause deadlock
				502	* because it holds page lock of a dirty page and request for
				503	* more grants. It's okay for the dirty page to be the first
				504	* one in commit page list, though.
				505	*/
Jinshan Xiong	d37dd10	2016-03-30 19:48:43 -0400	[diff] [blame]	506	if (vmpage && plist->pl_nr > 0) {
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	507	unlock_page(vmpage);
Greg Kroah-Hartman	5f47992	2016-04-11 09:30:50 -0700	[diff] [blame]	508	put_page(vmpage);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	509	vmpage = NULL;
				510	}
				511
				512	/* commit pages and then wait for page lock */
				513	result = vvp_io_write_commit(env, io);
				514	if (result < 0)
				515	goto out;
				516
				517	if (!vmpage) {
				518	vmpage = grab_cache_page_write_begin(mapping, index,
				519	flags);
				520	if (!vmpage) {
				521	result = -ENOMEM;
				522	goto out;
				523	}
				524	}
				525	}
				526
				527	page = cl_page_find(env, clob, vmpage->index, vmpage, CPT_CACHEABLE);
				528	if (IS_ERR(page)) {
				529	result = PTR_ERR(page);
				530	goto out;
				531	}
				532
				533	lcc->lcc_page = page;
				534	lu_ref_add(&page->cp_reference, "cl_io", io);
				535
				536	cl_page_assume(env, io, page);
				537	if (!PageUptodate(vmpage)) {
				538	/*
				539	* We're completely overwriting an existing page,
				540	* so _don't_ set it up to date until commit_write
				541	*/
				542	if (from == 0 && to == PAGE_SIZE) {
				543	CL_PAGE_HEADER(D_PAGE, env, page, "full page write\n");
				544	POISON_PAGE(vmpage, 0x11);
				545	} else {
				546	/* TODO: can be optimized at OSC layer to check if it
				547	* is a lockless IO. In that case, it's not necessary
				548	* to read the data.
				549	*/
				550	result = ll_prepare_partial_page(env, io, page);
				551	if (result == 0)
				552	SetPageUptodate(vmpage);
				553	}
				554	}
				555	if (result < 0)
				556	cl_page_unassume(env, io, page);
				557	out:
				558	if (result < 0) {
				559	if (vmpage) {
				560	unlock_page(vmpage);
Greg Kroah-Hartman	5f47992	2016-04-11 09:30:50 -0700	[diff] [blame]	561	put_page(vmpage);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	562	}
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	563	} else {
				564	*pagep = vmpage;
				565	*fsdata = lcc;
				566	}
				567	return result;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	568	}
				569
				570	static int ll_write_end(struct file file, struct address_space mapping,
				571	loff_t pos, unsigned len, unsigned copied,
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	572	struct page vmpage, void fsdata)
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	573	{
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	574	struct ll_cl_context *lcc = fsdata;
Jinshan Xiong	966c4a8	2016-06-05 23:28:51 -0400	[diff] [blame]	575	const struct lu_env *env;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	576	struct cl_io *io;
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	577	struct vvp_io *vio;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	578	struct cl_page *page;
Kirill A. Shutemov	09cbfea	2016-04-01 15:29:47 +0300	[diff] [blame]	579	unsigned from = pos & (PAGE_SIZE - 1);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	580	bool unplug = false;
				581	int result = 0;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	582
Greg Kroah-Hartman	5f47992	2016-04-11 09:30:50 -0700	[diff] [blame]	583	put_page(vmpage);
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	584
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	585	env = lcc->lcc_env;
				586	page = lcc->lcc_page;
				587	io = lcc->lcc_io;
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	588	vio = vvp_env_io(env);
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	589
				590	LASSERT(cl_page_is_owned(page, io));
				591	if (copied > 0) {
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	592	struct cl_page_list *plist = &vio->u.write.vui_queue;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	593
				594	lcc->lcc_page = NULL; /* page will be queued */
				595
				596	/* Add it into write queue */
				597	cl_page_list_add(plist, page);
				598	if (plist->pl_nr == 1) /* first page */
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	599	vio->u.write.vui_from = from;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	600	else
				601	LASSERT(from == 0);
John L. Hammond	e0a8144	2016-03-30 19:48:52 -0400	[diff] [blame]	602	vio->u.write.vui_to = from + copied;
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	603
Jinshan Xiong	297e908	2016-08-16 16:18:58 -0400	[diff] [blame]	604	/*
				605	* To address the deadlock in balance_dirty_pages() where
				606	* this dirty page may be written back in the same thread.
				607	*/
				608	if (PageDirty(vmpage))
				609	unplug = true;
				610
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	611	/* We may have one full RPC, commit it soon */
				612	if (plist->pl_nr >= PTLRPC_MAX_BRW_PAGES)
				613	unplug = true;
				614
				615	CL_PAGE_DEBUG(D_VFSTRACE, env, page,
				616	"queued page: %d.\n", plist->pl_nr);
				617	} else {
				618	cl_page_disown(env, io, page);
				619
Jinshan Xiong	966c4a8	2016-06-05 23:28:51 -0400	[diff] [blame]	620	lcc->lcc_page = NULL;
				621	lu_ref_del(&page->cp_reference, "cl_io", io);
				622	cl_page_put(env, page);
				623
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	624	/* page list is not contiguous now, commit it now */
				625	unplug = true;
				626	}
				627
				628	if (unplug \|\|
				629	file->f_flags & O_SYNC \|\| IS_SYNC(file_inode(file)))
				630	result = vvp_io_write_commit(env, io);
				631
Jinshan Xiong	77605e4	2016-03-30 19:48:30 -0400	[diff] [blame]	632	return result >= 0 ? copied : result;
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	633	}
				634
				635	#ifdef CONFIG_MIGRATION
John L. Hammond	2d95f10	2014-04-27 13:07:05 -0400	[diff] [blame]	636	static int ll_migratepage(struct address_space *mapping,
Oleg Drokin	e15ba45	2016-02-26 01:49:49 -0500	[diff] [blame]	637	struct page newpage, struct page page,
				638	enum migrate_mode mode
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	639	)
				640	{
				641	/* Always fail page migration until we have a proper implementation */
				642	return -EIO;
				643	}
				644	#endif
				645
John L. Hammond	2d95f10	2014-04-27 13:07:05 -0400	[diff] [blame]	646	const struct address_space_operations ll_aops = {
				647	.readpage = ll_readpage,
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	648	.direct_IO = ll_direct_IO_26,
				649	.writepage = ll_writepage,
				650	.writepages = ll_writepages,
Jinshan Xiong	7addf40	2016-03-30 19:48:32 -0400	[diff] [blame]	651	.set_page_dirty = __set_page_dirty_nobuffers,
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	652	.write_begin = ll_write_begin,
				653	.write_end = ll_write_end,
				654	.invalidatepage = ll_invalidatepage,
				655	.releasepage = (void *)ll_releasepage,
				656	#ifdef CONFIG_MIGRATION
				657	.migratepage = ll_migratepage,
				658	#endif
Peng Tao	d7e09d0	2013-05-02 16:46:55 +0800	[diff] [blame]	659	};