Blame - drivers/md/dm-thin.c - kernel/msm-4.9

blob: 2ade2c46dca9e30473775b7f2d9cf0ea163c0857 [file] [log] [blame]

Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1	/*
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2	* Copyright (C) 2011-2012 Red Hat UK.
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3	*
				4	* This file is released under the GPL.
				5	*/
				6
				7	#include "dm-thin-metadata.h"
Mike Snitzer	4f81a41	2012-10-12 21:02:13 +0100	[diff] [blame]	8	#include "dm-bio-prison.h"
Alasdair G Kergon	1f4e0ff	2012-07-27 15:08:16 +0100	[diff] [blame]	9	#include "dm.h"
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	10
				11	#include <linux/device-mapper.h>
				12	#include <linux/dm-io.h>
				13	#include <linux/dm-kcopyd.h>
Manuel Schölling	0f30af9	2014-05-22 22:42:37 +0200	[diff] [blame]	14	#include <linux/jiffies.h>
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	15	#include <linux/log2.h>
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	16	#include <linux/list.h>
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	17	#include <linux/rculist.h>
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	18	#include <linux/init.h>
				19	#include <linux/module.h>
				20	#include <linux/slab.h>
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	21	#include <linux/sort.h>
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	22	#include <linux/rbtree.h>
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	23
				24	#define DM_MSG_PREFIX "thin"
				25
				26	/*
				27	* Tunable constants
				28	*/
Alasdair G Kergon	7768ed3	2012-07-27 15:07:57 +0100	[diff] [blame]	29	#define ENDIO_HOOK_POOL_SIZE 1024
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	30	#define MAPPING_POOL_SIZE 1024
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	31	#define COMMIT_PERIOD HZ
Mike Snitzer	80c5789	2014-05-20 13:38:33 -0400	[diff] [blame]	32	#define NO_SPACE_TIMEOUT_SECS 60
				33
				34	static unsigned no_space_timeout_secs = NO_SPACE_TIMEOUT_SECS;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	35
Mikulas Patocka	df5d2e9	2013-03-01 22:45:49 +0000	[diff] [blame]	36	DECLARE_DM_KCOPYD_THROTTLE_WITH_MODULE_PARM(snapshot_copy_throttle,
				37	"A percentage of time allocated for copy on write");
				38
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	39	/*
				40	* The block size of the device holding pool data must be
				41	* between 64KB and 1GB.
				42	*/
				43	#define DATA_DEV_BLOCK_SIZE_MIN_SECTORS (64 * 1024 >> SECTOR_SHIFT)
				44	#define DATA_DEV_BLOCK_SIZE_MAX_SECTORS (1024 * 1024 * 1024 >> SECTOR_SHIFT)
				45
				46	/*
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	47	* Device id is restricted to 24 bits.
				48	*/
				49	#define MAX_DEV_ID ((1 << 24) - 1)
				50
				51	/*
				52	* How do we handle breaking sharing of data blocks?
				53	* =================================================
				54	*
				55	* We use a standard copy-on-write btree to store the mappings for the
				56	* devices (note I'm talking about copy-on-write of the metadata here, not
				57	* the data). When you take an internal snapshot you clone the root node
				58	* of the origin btree. After this there is no concept of an origin or a
				59	* snapshot. They are just two device trees that happen to point to the
				60	* same data blocks.
				61	*
				62	* When we get a write in we decide if it's to a shared data block using
				63	* some timestamp magic. If it is, we have to break sharing.
				64	*
				65	* Let's say we write to a shared block in what was the origin. The
				66	* steps are:
				67	*
				68	* i) plug io further to this physical block. (see bio_prison code).
				69	*
				70	* ii) quiesce any read io to that shared data block. Obviously
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	71	* including all devices that share this block. (see dm_deferred_set code)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	72	*
				73	* iii) copy the data block to a newly allocate block. This step can be
				74	* missed out if the io covers the block. (schedule_copy).
				75	*
				76	* iv) insert the new mapping into the origin's btree
Joe Thornber	fe878f3	2012-03-28 18:41:24 +0100	[diff] [blame]	77	* (process_prepared_mapping). This act of inserting breaks some
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	78	* sharing of btree nodes between the two devices. Breaking sharing only
				79	* effects the btree of that specific device. Btrees for the other
				80	* devices that share the block never change. The btree for the origin
				81	* device as it was after the last commit is untouched, ie. we're using
				82	* persistent data structures in the functional programming sense.
				83	*
				84	* v) unplug io to this physical block, including the io that triggered
				85	* the breaking of sharing.
				86	*
				87	* Steps (ii) and (iii) occur in parallel.
				88	*
				89	* The metadata _doesn't_ need to be committed before the io continues. We
				90	* get away with this because the io is always written to a _new_ block.
				91	* If there's a crash, then:
				92	*
				93	* - The origin mapping will point to the old origin block (the shared
				94	* one). This will contain the data as it was before the io that triggered
				95	* the breaking of sharing came in.
				96	*
				97	* - The snap mapping still points to the old block. As it would after
				98	* the commit.
				99	*
				100	* The downside of this scheme is the timestamp magic isn't perfect, and
				101	* will continue to think that data block in the snapshot device is shared
				102	* even after the write to the origin has broken sharing. I suspect data
				103	* blocks will typically be shared by many different devices, so we're
				104	* breaking sharing n + 1 times, rather than n, where n is the number of
				105	* devices that reference this data block. At the moment I think the
				106	* benefits far, far outweigh the disadvantages.
				107	*/
				108
				109	/----------------------------------------------------------------/
				110
				111	/*
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	112	* Key building.
				113	*/
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	114	enum lock_space {
				115	VIRTUAL,
				116	PHYSICAL
				117	};
				118
				119	static void build_key(struct dm_thin_device *td, enum lock_space ls,
				120	dm_block_t b, dm_block_t e, struct dm_cell_key *key)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	121	{
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	122	key->virtual = (ls == VIRTUAL);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	123	key->dev = dm_thin_dev_id(td);
Joe Thornber	5f274d8	2014-09-17 10:17:39 +0100	[diff] [blame]	124	key->block_begin = b;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	125	key->block_end = e;
				126	}
				127
				128	static void build_data_key(struct dm_thin_device *td, dm_block_t b,
				129	struct dm_cell_key *key)
				130	{
				131	build_key(td, PHYSICAL, b, b + 1llu, key);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	132	}
				133
				134	static void build_virtual_key(struct dm_thin_device *td, dm_block_t b,
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	135	struct dm_cell_key *key)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	136	{
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	137	build_key(td, VIRTUAL, b, b + 1llu, key);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	138	}
				139
				140	/----------------------------------------------------------------/
				141
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	142	#define THROTTLE_THRESHOLD (1 * HZ)
				143
				144	struct throttle {
				145	struct rw_semaphore lock;
				146	unsigned long threshold;
				147	bool throttle_applied;
				148	};
				149
				150	static void throttle_init(struct throttle *t)
				151	{
				152	init_rwsem(&t->lock);
				153	t->throttle_applied = false;
				154	}
				155
				156	static void throttle_work_start(struct throttle *t)
				157	{
				158	t->threshold = jiffies + THROTTLE_THRESHOLD;
				159	}
				160
				161	static void throttle_work_update(struct throttle *t)
				162	{
				163	if (!t->throttle_applied && jiffies > t->threshold) {
				164	down_write(&t->lock);
				165	t->throttle_applied = true;
				166	}
				167	}
				168
				169	static void throttle_work_complete(struct throttle *t)
				170	{
				171	if (t->throttle_applied) {
				172	t->throttle_applied = false;
				173	up_write(&t->lock);
				174	}
				175	}
				176
				177	static void throttle_lock(struct throttle *t)
				178	{
				179	down_read(&t->lock);
				180	}
				181
				182	static void throttle_unlock(struct throttle *t)
				183	{
				184	up_read(&t->lock);
				185	}
				186
				187	/----------------------------------------------------------------/
				188
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	189	/*
				190	* A pool device ties together a metadata device and a data device. It
				191	* also provides the interface for creating and destroying internal
				192	* devices.
				193	*/
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	194	struct dm_thin_new_mapping;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	195
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	196	/*
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	197	* The pool runs in 4 modes. Ordered in degraded order for comparisons.
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	198	*/
				199	enum pool_mode {
				200	PM_WRITE, /* metadata may be changed */
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	201	PM_OUT_OF_DATA_SPACE, /* metadata may be changed, though data may not be allocated */
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	202	PM_READ_ONLY, /* metadata may not be changed */
				203	PM_FAIL, /* all I/O fails */
				204	};
				205
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	206	struct pool_features {
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	207	enum pool_mode mode;
				208
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	209	bool zero_new_blocks:1;
				210	bool discard_enabled:1;
				211	bool discard_passdown:1;
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	212	bool error_if_no_space:1;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	213	};
				214
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	215	struct thin_c;
				216	typedef void (process_bio_fn)(struct thin_c tc, struct bio *bio);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	217	typedef void (process_cell_fn)(struct thin_c tc, struct dm_bio_prison_cell *cell);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	218	typedef void (process_mapping_fn)(struct dm_thin_new_mapping m);
				219
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	220	#define CELL_SORT_ARRAY_SIZE 8192
				221
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	222	struct pool {
				223	struct list_head list;
				224	struct dm_target ti; / Only set if a pool target is bound */
				225
				226	struct mapped_device *pool_md;
				227	struct block_device *md_dev;
				228	struct dm_pool_metadata *pmd;
				229
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	230	dm_block_t low_water_blocks;
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	231	uint32_t sectors_per_block;
Mikulas Patocka	f9a8e0c	2012-07-27 15:08:03 +0100	[diff] [blame]	232	int sectors_per_block_shift;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	233
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	234	struct pool_features pf;
Joe Thornber	88a6621	2013-12-04 20:16:12 -0500	[diff] [blame]	235	bool low_water_triggered:1; /* A dm event has been sent */
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	236	bool suspended:1;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	237
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	238	struct dm_bio_prison *prison;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	239	struct dm_kcopyd_client *copier;
				240
				241	struct workqueue_struct *wq;
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	242	struct throttle throttle;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	243	struct work_struct worker;
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	244	struct delayed_work waker;
Joe Thornber	85ad643b	2014-05-09 15:59:38 +0100	[diff] [blame]	245	struct delayed_work no_space_timeout;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	246
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	247	unsigned long last_commit_jiffies;
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	248	unsigned ref_count;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	249
				250	spinlock_t lock;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	251	struct bio_list deferred_flush_bios;
				252	struct list_head prepared_mappings;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	253	struct list_head prepared_discards;
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	254	struct list_head active_thins;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	255
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	256	struct dm_deferred_set *shared_read_ds;
				257	struct dm_deferred_set *all_io_ds;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	258
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	259	struct dm_thin_new_mapping *next_mapping;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	260	mempool_t *mapping_pool;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	261
				262	process_bio_fn process_bio;
				263	process_bio_fn process_discard;
				264
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	265	process_cell_fn process_cell;
				266	process_cell_fn process_discard_cell;
				267
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	268	process_mapping_fn process_prepared_mapping;
				269	process_mapping_fn process_prepared_discard;
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	270
				271	struct dm_bio_prison_cell *cell_sort_array[CELL_SORT_ARRAY_SIZE];
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	272	};
				273
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	274	static enum pool_mode get_pool_mode(struct pool *pool);
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	275	static void metadata_operation_failed(struct pool pool, const char op, int r);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	276
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	277	/*
				278	* Target context for a pool.
				279	*/
				280	struct pool_c {
				281	struct dm_target *ti;
				282	struct pool *pool;
				283	struct dm_dev *data_dev;
				284	struct dm_dev *metadata_dev;
				285	struct dm_target_callbacks callbacks;
				286
				287	dm_block_t low_water_blocks;
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	288	struct pool_features requested_pf; /* Features requested during table load */
				289	struct pool_features adjusted_pf; /* Features used after adjusting for constituent devices */
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	290	};
				291
				292	/*
				293	* Target context for a thin.
				294	*/
				295	struct thin_c {
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	296	struct list_head list;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	297	struct dm_dev *pool_dev;
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	298	struct dm_dev *origin_dev;
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	299	sector_t origin_size;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	300	dm_thin_id dev_id;
				301
				302	struct pool *pool;
				303	struct dm_thin_device *td;
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	304	struct mapped_device *thin_md;
				305
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	306	bool requeue_mode:1;
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	307	spinlock_t lock;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	308	struct list_head deferred_cells;
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	309	struct bio_list deferred_bio_list;
				310	struct bio_list retry_on_resume_list;
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	311	struct rb_root sort_bio_list; /* sorted list of deferred bios */
Joe Thornber	b10ebd3	2014-04-08 11:29:01 +0100	[diff] [blame]	312
				313	/*
				314	* Ensures the thin is not destroyed until the worker has finished
				315	* iterating the active_thins list.
				316	*/
				317	atomic_t refcount;
				318	struct completion can_destroy;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	319	};
				320
				321	/----------------------------------------------------------------/
				322
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	323	/**
				324	* __blkdev_issue_discard_async - queue a discard with async completion
				325	* @bdev: blockdev to issue discard for
				326	* @sector: start sector
				327	* @nr_sects: number of sectors to discard
				328	* @gfp_mask: memory allocation flags (for bio_alloc)
				329	* @flags: BLKDEV_IFL_* flags to control behaviour
				330	* @parent_bio: parent discard bio that all sub discards get chained to
				331	*
				332	* Description:
				333	* Asynchronously issue a discard request for the sectors in question.
				334	* NOTE: this variant of blk-core's blkdev_issue_discard() is a stop-gap
				335	* that is being kept local to DM thinp until the block changes to allow
				336	* late bio splitting land upstream.
				337	*/
				338	static int __blkdev_issue_discard_async(struct block_device *bdev, sector_t sector,
				339	sector_t nr_sects, gfp_t gfp_mask, unsigned long flags,
				340	struct bio *parent_bio)
				341	{
				342	struct request_queue *q = bdev_get_queue(bdev);
				343	int type = REQ_WRITE \| REQ_DISCARD;
				344	unsigned int max_discard_sectors, granularity;
				345	int alignment;
				346	struct bio *bio;
				347	int ret = 0;
				348	struct blk_plug plug;
				349
				350	if (!q)
				351	return -ENXIO;
				352
				353	if (!blk_queue_discard(q))
				354	return -EOPNOTSUPP;
				355
				356	/* Zero-sector (unknown) and one-sector granularities are the same. */
				357	granularity = max(q->limits.discard_granularity >> 9, 1U);
				358	alignment = (bdev_discard_alignment(bdev) >> 9) % granularity;
				359
				360	/*
				361	* Ensure that max_discard_sectors is of the proper
				362	* granularity, so that requests stay aligned after a split.
				363	*/
				364	max_discard_sectors = min(q->limits.max_discard_sectors, UINT_MAX >> 9);
				365	max_discard_sectors -= max_discard_sectors % granularity;
				366	if (unlikely(!max_discard_sectors)) {
				367	/* Avoid infinite loop below. Being cautious never hurts. */
				368	return -EOPNOTSUPP;
				369	}
				370
				371	if (flags & BLKDEV_DISCARD_SECURE) {
				372	if (!blk_queue_secdiscard(q))
				373	return -EOPNOTSUPP;
				374	type \|= REQ_SECURE;
				375	}
				376
				377	blk_start_plug(&plug);
				378	while (nr_sects) {
				379	unsigned int req_sects;
				380	sector_t end_sect, tmp;
				381
				382	/*
				383	* Required bio_put occurs in bio_endio thanks to bio_chain below
				384	*/
				385	bio = bio_alloc(gfp_mask, 1);
				386	if (!bio) {
				387	ret = -ENOMEM;
				388	break;
				389	}
				390
				391	req_sects = min_t(sector_t, nr_sects, max_discard_sectors);
				392
				393	/*
				394	* If splitting a request, and the next starting sector would be
				395	* misaligned, stop the discard at the previous aligned sector.
				396	*/
				397	end_sect = sector + req_sects;
				398	tmp = end_sect;
				399	if (req_sects < nr_sects &&
				400	sector_div(tmp, granularity) != alignment) {
				401	end_sect = end_sect - alignment;
				402	sector_div(end_sect, granularity);
				403	end_sect = end_sect * granularity + alignment;
				404	req_sects = end_sect - sector;
				405	}
				406
				407	bio_chain(bio, parent_bio);
				408
				409	bio->bi_iter.bi_sector = sector;
				410	bio->bi_bdev = bdev;
				411
				412	bio->bi_iter.bi_size = req_sects << 9;
				413	nr_sects -= req_sects;
				414	sector = end_sect;
				415
				416	submit_bio(type, bio);
				417
				418	/*
				419	* We can loop for a long time in here, if someone does
				420	* full device discards (like mkfs). Be nice and allow
				421	* us to schedule out to avoid softlocking if preempt
				422	* is disabled.
				423	*/
				424	cond_resched();
				425	}
				426	blk_finish_plug(&plug);
				427
				428	return ret;
				429	}
				430
				431	static bool block_size_is_power_of_two(struct pool *pool)
				432	{
				433	return pool->sectors_per_block_shift >= 0;
				434	}
				435
				436	static sector_t block_to_sectors(struct pool *pool, dm_block_t b)
				437	{
				438	return block_size_is_power_of_two(pool) ?
				439	(b << pool->sectors_per_block_shift) :
				440	(b * pool->sectors_per_block);
				441	}
				442
				443	static int issue_discard(struct thin_c *tc, dm_block_t data_b, dm_block_t data_e,
				444	struct bio *parent_bio)
				445	{
				446	sector_t s = block_to_sectors(tc->pool, data_b);
				447	sector_t len = block_to_sectors(tc->pool, data_e - data_b);
				448
				449	return __blkdev_issue_discard_async(tc->pool_dev->bdev, s, len,
				450	GFP_NOWAIT, 0, parent_bio);
				451	}
				452
				453	/----------------------------------------------------------------/
				454
Joe Thornber	025b968	2013-03-01 22:45:50 +0000	[diff] [blame]	455	/*
				456	* wake_worker() is used when new work is queued and when pool_resume is
				457	* ready to continue deferred IO processing.
				458	*/
				459	static void wake_worker(struct pool *pool)
				460	{
				461	queue_work(pool->wq, &pool->worker);
				462	}
				463
				464	/----------------------------------------------------------------/
				465
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	466	static int bio_detain(struct pool pool, struct dm_cell_key key, struct bio *bio,
				467	struct dm_bio_prison_cell **cell_result)
				468	{
				469	int r;
				470	struct dm_bio_prison_cell *cell_prealloc;
				471
				472	/*
				473	* Allocate a cell from the prison's mempool.
				474	* This might block but it can't fail.
				475	*/
				476	cell_prealloc = dm_bio_prison_alloc_cell(pool->prison, GFP_NOIO);
				477
				478	r = dm_bio_detain(pool->prison, key, bio, cell_prealloc, cell_result);
				479	if (r)
				480	/*
				481	* We reused an old cell; we can get rid of
				482	* the new one.
				483	*/
				484	dm_bio_prison_free_cell(pool->prison, cell_prealloc);
				485
				486	return r;
				487	}
				488
				489	static void cell_release(struct pool *pool,
				490	struct dm_bio_prison_cell *cell,
				491	struct bio_list *bios)
				492	{
				493	dm_cell_release(pool->prison, cell, bios);
				494	dm_bio_prison_free_cell(pool->prison, cell);
				495	}
				496
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	497	static void cell_visit_release(struct pool *pool,
				498	void (fn)(void , struct dm_bio_prison_cell *),
				499	void *context,
				500	struct dm_bio_prison_cell *cell)
				501	{
				502	dm_cell_visit_release(pool->prison, fn, context, cell);
				503	dm_bio_prison_free_cell(pool->prison, cell);
				504	}
				505
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	506	static void cell_release_no_holder(struct pool *pool,
				507	struct dm_bio_prison_cell *cell,
				508	struct bio_list *bios)
				509	{
				510	dm_cell_release_no_holder(pool->prison, cell, bios);
				511	dm_bio_prison_free_cell(pool->prison, cell);
				512	}
				513
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	514	static void cell_error_with_code(struct pool *pool,
				515	struct dm_bio_prison_cell *cell, int error_code)
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	516	{
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	517	dm_cell_error(pool->prison, cell, error_code);
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	518	dm_bio_prison_free_cell(pool->prison, cell);
				519	}
				520
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	521	static void cell_error(struct pool pool, struct dm_bio_prison_cell cell)
				522	{
				523	cell_error_with_code(pool, cell, -EIO);
				524	}
				525
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	526	static void cell_success(struct pool pool, struct dm_bio_prison_cell cell)
				527	{
				528	cell_error_with_code(pool, cell, 0);
				529	}
				530
				531	static void cell_requeue(struct pool pool, struct dm_bio_prison_cell cell)
				532	{
				533	cell_error_with_code(pool, cell, DM_ENDIO_REQUEUE);
				534	}
				535
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	536	/----------------------------------------------------------------/
				537
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	538	/*
				539	* A global list of pools that uses a struct mapped_device as a key.
				540	*/
				541	static struct dm_thin_pool_table {
				542	struct mutex mutex;
				543	struct list_head pools;
				544	} dm_thin_pool_table;
				545
				546	static void pool_table_init(void)
				547	{
				548	mutex_init(&dm_thin_pool_table.mutex);
				549	INIT_LIST_HEAD(&dm_thin_pool_table.pools);
				550	}
				551
				552	static void __pool_table_insert(struct pool *pool)
				553	{
				554	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				555	list_add(&pool->list, &dm_thin_pool_table.pools);
				556	}
				557
				558	static void __pool_table_remove(struct pool *pool)
				559	{
				560	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				561	list_del(&pool->list);
				562	}
				563
				564	static struct pool __pool_table_lookup(struct mapped_device md)
				565	{
				566	struct pool pool = NULL, tmp;
				567
				568	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				569
				570	list_for_each_entry(tmp, &dm_thin_pool_table.pools, list) {
				571	if (tmp->pool_md == md) {
				572	pool = tmp;
				573	break;
				574	}
				575	}
				576
				577	return pool;
				578	}
				579
				580	static struct pool __pool_table_lookup_metadata_dev(struct block_device md_dev)
				581	{
				582	struct pool pool = NULL, tmp;
				583
				584	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				585
				586	list_for_each_entry(tmp, &dm_thin_pool_table.pools, list) {
				587	if (tmp->md_dev == md_dev) {
				588	pool = tmp;
				589	break;
				590	}
				591	}
				592
				593	return pool;
				594	}
				595
				596	/----------------------------------------------------------------/
				597
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	598	struct dm_thin_endio_hook {
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	599	struct thin_c *tc;
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	600	struct dm_deferred_entry *shared_read_entry;
				601	struct dm_deferred_entry *all_io_entry;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	602	struct dm_thin_new_mapping *overwrite_mapping;
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	603	struct rb_node rb_node;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	604	struct dm_bio_prison_cell *cell;
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	605	};
				606
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	607	static void __merge_bio_list(struct bio_list bios, struct bio_list master)
				608	{
				609	bio_list_merge(bios, master);
				610	bio_list_init(master);
				611	}
				612
				613	static void error_bio_list(struct bio_list *bios, int error)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	614	{
				615	struct bio *bio;
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	616
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	617	while ((bio = bio_list_pop(bios))) {
				618	bio->bi_error = error;
				619	bio_endio(bio);
				620	}
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	621	}
				622
				623	static void error_thin_bio_list(struct thin_c tc, struct bio_list master, int error)
				624	{
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	625	struct bio_list bios;
Joe Thornber	18adc57	2014-03-03 15:46:42 +0000	[diff] [blame]	626	unsigned long flags;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	627
				628	bio_list_init(&bios);
Joe Thornber	18adc57	2014-03-03 15:46:42 +0000	[diff] [blame]	629
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	630	spin_lock_irqsave(&tc->lock, flags);
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	631	__merge_bio_list(&bios, master);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	632	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	633
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	634	error_bio_list(&bios, error);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	635	}
				636
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	637	static void requeue_deferred_cells(struct thin_c *tc)
				638	{
				639	struct pool *pool = tc->pool;
				640	unsigned long flags;
				641	struct list_head cells;
				642	struct dm_bio_prison_cell cell, tmp;
				643
				644	INIT_LIST_HEAD(&cells);
				645
				646	spin_lock_irqsave(&tc->lock, flags);
				647	list_splice_init(&tc->deferred_cells, &cells);
				648	spin_unlock_irqrestore(&tc->lock, flags);
				649
				650	list_for_each_entry_safe(cell, tmp, &cells, user_list)
				651	cell_requeue(pool, cell);
				652	}
				653
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	654	static void requeue_io(struct thin_c *tc)
				655	{
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	656	struct bio_list bios;
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	657	unsigned long flags;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	658
				659	bio_list_init(&bios);
				660
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	661	spin_lock_irqsave(&tc->lock, flags);
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	662	__merge_bio_list(&bios, &tc->deferred_bio_list);
				663	__merge_bio_list(&bios, &tc->retry_on_resume_list);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	664	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	665
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	666	error_bio_list(&bios, DM_ENDIO_REQUEUE);
				667	requeue_deferred_cells(tc);
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	668	}
				669
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	670	static void error_retry_list(struct pool *pool)
				671	{
				672	struct thin_c *tc;
				673
				674	rcu_read_lock();
				675	list_for_each_entry_rcu(tc, &pool->active_thins, list)
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	676	error_thin_bio_list(tc, &tc->retry_on_resume_list, -EIO);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	677	rcu_read_unlock();
				678	}
				679
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	680	/*
				681	* This section of code contains the logic for processing a thin device's IO.
				682	* Much of the code depends on pool object resources (lists, workqueues, etc)
				683	* but most is exclusively called from the thin target rather than the thin-pool
				684	* target.
				685	*/
				686
				687	static dm_block_t get_bio_block(struct thin_c tc, struct bio bio)
				688	{
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	689	struct pool *pool = tc->pool;
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	690	sector_t block_nr = bio->bi_iter.bi_sector;
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	691
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	692	if (block_size_is_power_of_two(pool))
				693	block_nr >>= pool->sectors_per_block_shift;
Mikulas Patocka	f9a8e0c	2012-07-27 15:08:03 +0100	[diff] [blame]	694	else
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	695	(void) sector_div(block_nr, pool->sectors_per_block);
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	696
				697	return block_nr;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	698	}
				699
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	700	/*
				701	* Returns the _complete_ blocks that this bio covers.
				702	*/
				703	static void get_bio_block_range(struct thin_c tc, struct bio bio,
				704	dm_block_t begin, dm_block_t end)
				705	{
				706	struct pool *pool = tc->pool;
				707	sector_t b = bio->bi_iter.bi_sector;
				708	sector_t e = b + (bio->bi_iter.bi_size >> SECTOR_SHIFT);
				709
				710	b += pool->sectors_per_block - 1ull; /* so we round up */
				711
				712	if (block_size_is_power_of_two(pool)) {
				713	b >>= pool->sectors_per_block_shift;
				714	e >>= pool->sectors_per_block_shift;
				715	} else {
				716	(void) sector_div(b, pool->sectors_per_block);
				717	(void) sector_div(e, pool->sectors_per_block);
				718	}
				719
				720	if (e < b)
				721	/* Can happen if the bio is within a single block. */
				722	e = b;
				723
				724	*begin = b;
				725	*end = e;
				726	}
				727
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	728	static void remap(struct thin_c tc, struct bio bio, dm_block_t block)
				729	{
				730	struct pool *pool = tc->pool;
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	731	sector_t bi_sector = bio->bi_iter.bi_sector;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	732
				733	bio->bi_bdev = tc->pool_dev->bdev;
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	734	if (block_size_is_power_of_two(pool))
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	735	bio->bi_iter.bi_sector =
				736	(block << pool->sectors_per_block_shift) \|
				737	(bi_sector & (pool->sectors_per_block - 1));
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	738	else
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	739	bio->bi_iter.bi_sector = (block * pool->sectors_per_block) +
Mike Snitzer	58f77a2	2013-03-01 22:45:45 +0000	[diff] [blame]	740	sector_div(bi_sector, pool->sectors_per_block);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	741	}
				742
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	743	static void remap_to_origin(struct thin_c tc, struct bio bio)
				744	{
				745	bio->bi_bdev = tc->origin_dev->bdev;
				746	}
				747
Joe Thornber	4afdd68	2012-07-27 15:08:14 +0100	[diff] [blame]	748	static int bio_triggers_commit(struct thin_c tc, struct bio bio)
				749	{
				750	return (bio->bi_rw & (REQ_FLUSH \| REQ_FUA)) &&
				751	dm_thin_changed_this_transaction(tc->td);
				752	}
				753
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	754	static void inc_all_io_entry(struct pool pool, struct bio bio)
				755	{
				756	struct dm_thin_endio_hook *h;
				757
				758	if (bio->bi_rw & REQ_DISCARD)
				759	return;
				760
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	761	h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	762	h->all_io_entry = dm_deferred_entry_inc(pool->all_io_ds);
				763	}
				764
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	765	static void issue(struct thin_c tc, struct bio bio)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	766	{
				767	struct pool *pool = tc->pool;
				768	unsigned long flags;
				769
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	770	if (!bio_triggers_commit(tc, bio)) {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	771	generic_make_request(bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	772	return;
				773	}
				774
				775	/*
				776	* Complete bio with an error if earlier I/O caused changes to
				777	* the metadata that can't be committed e.g, due to I/O errors
				778	* on the metadata device.
				779	*/
				780	if (dm_thin_aborted_changes(tc->td)) {
				781	bio_io_error(bio);
				782	return;
				783	}
				784
				785	/*
				786	* Batch together any bios that trigger commits and then issue a
				787	* single commit for them in process_deferred_bios().
				788	*/
				789	spin_lock_irqsave(&pool->lock, flags);
				790	bio_list_add(&pool->deferred_flush_bios, bio);
				791	spin_unlock_irqrestore(&pool->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	792	}
				793
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	794	static void remap_to_origin_and_issue(struct thin_c tc, struct bio bio)
				795	{
				796	remap_to_origin(tc, bio);
				797	issue(tc, bio);
				798	}
				799
				800	static void remap_and_issue(struct thin_c tc, struct bio bio,
				801	dm_block_t block)
				802	{
				803	remap(tc, bio, block);
				804	issue(tc, bio);
				805	}
				806
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	807	/----------------------------------------------------------------/
				808
				809	/*
				810	* Bio endio functions.
				811	*/
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	812	struct dm_thin_new_mapping {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	813	struct list_head list;
				814
Mike Snitzer	7f21466	2013-12-17 13:43:31 -0500	[diff] [blame]	815	bool pass_discard:1;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	816	bool maybe_shared:1;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	817
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	818	/*
				819	* Track quiescing, copying and zeroing preparation actions. When this
				820	* counter hits zero the block is prepared and can be inserted into the
				821	* btree.
				822	*/
				823	atomic_t prepare_actions;
				824
Mike Snitzer	7f21466	2013-12-17 13:43:31 -0500	[diff] [blame]	825	int err;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	826	struct thin_c *tc;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	827	dm_block_t virt_begin, virt_end;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	828	dm_block_t data_block;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	829	struct dm_bio_prison_cell *cell;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	830
				831	/*
				832	* If the bio covers the whole area of a block then we can avoid
				833	* zeroing or copying. Instead this bio is hooked. The bio will
				834	* still be in the cell, so care has to be taken to avoid issuing
				835	* the bio twice.
				836	*/
				837	struct bio *bio;
				838	bio_end_io_t *saved_bi_end_io;
				839	};
				840
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	841	static void __complete_mapping_preparation(struct dm_thin_new_mapping *m)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	842	{
				843	struct pool *pool = m->tc->pool;
				844
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	845	if (atomic_dec_and_test(&m->prepare_actions)) {
Mike Snitzer	daec338	2013-12-11 14:01:20 -0500	[diff] [blame]	846	list_add_tail(&m->list, &pool->prepared_mappings);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	847	wake_worker(pool);
				848	}
				849	}
				850
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	851	static void complete_mapping_preparation(struct dm_thin_new_mapping *m)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	852	{
				853	unsigned long flags;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	854	struct pool *pool = m->tc->pool;
				855
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	856	spin_lock_irqsave(&pool->lock, flags);
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	857	__complete_mapping_preparation(m);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	858	spin_unlock_irqrestore(&pool->lock, flags);
				859	}
				860
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	861	static void copy_complete(int read_err, unsigned long write_err, void *context)
				862	{
				863	struct dm_thin_new_mapping *m = context;
				864
				865	m->err = read_err \|\| write_err ? -EIO : 0;
				866	complete_mapping_preparation(m);
				867	}
				868
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	869	static void overwrite_endio(struct bio *bio)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	870	{
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	871	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	872	struct dm_thin_new_mapping *m = h->overwrite_mapping;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	873
Mike Snitzer	8b908f8	2015-05-13 17:53:13 -0400	[diff] [blame]	874	bio->bi_end_io = m->saved_bi_end_io;
				875
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	876	m->err = bio->bi_error;
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	877	complete_mapping_preparation(m);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	878	}
				879
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	880	/----------------------------------------------------------------/
				881
				882	/*
				883	* Workqueue.
				884	*/
				885
				886	/*
				887	* Prepared mapping jobs.
				888	*/
				889
				890	/*
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	891	* This sends the bios in the cell, except the original holder, back
				892	* to the deferred_bios list.
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	893	*/
Joe Thornber	f286ba0	2012-12-21 20:23:33 +0000	[diff] [blame]	894	static void cell_defer_no_holder(struct thin_c tc, struct dm_bio_prison_cell cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	895	{
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	896	struct pool *pool = tc->pool;
				897	unsigned long flags;
				898
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	899	spin_lock_irqsave(&tc->lock, flags);
				900	cell_release_no_holder(pool, cell, &tc->deferred_bio_list);
				901	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	902
				903	wake_worker(pool);
				904	}
				905
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	906	static void thin_defer_bio(struct thin_c tc, struct bio bio);
				907
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	908	struct remap_info {
				909	struct thin_c *tc;
				910	struct bio_list defer_bios;
				911	struct bio_list issue_bios;
				912	};
				913
				914	static void __inc_remap_and_issue_cell(void *context,
				915	struct dm_bio_prison_cell *cell)
				916	{
				917	struct remap_info *info = context;
				918	struct bio *bio;
				919
				920	while ((bio = bio_list_pop(&cell->bios))) {
				921	if (bio->bi_rw & (REQ_DISCARD \| REQ_FLUSH \| REQ_FUA))
				922	bio_list_add(&info->defer_bios, bio);
				923	else {
				924	inc_all_io_entry(info->tc->pool, bio);
				925
				926	/*
				927	* We can't issue the bios with the bio prison lock
				928	* held, so we add them to a list to issue on
				929	* return from this function.
				930	*/
				931	bio_list_add(&info->issue_bios, bio);
				932	}
				933	}
				934	}
				935
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	936	static void inc_remap_and_issue_cell(struct thin_c *tc,
				937	struct dm_bio_prison_cell *cell,
				938	dm_block_t block)
				939	{
				940	struct bio *bio;
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	941	struct remap_info info;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	942
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	943	info.tc = tc;
				944	bio_list_init(&info.defer_bios);
				945	bio_list_init(&info.issue_bios);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	946
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	947	/*
				948	* We have to be careful to inc any bios we're about to issue
				949	* before the cell is released, and avoid a race with new bios
				950	* being added to the cell.
				951	*/
				952	cell_visit_release(tc->pool, __inc_remap_and_issue_cell,
				953	&info, cell);
				954
				955	while ((bio = bio_list_pop(&info.defer_bios)))
				956	thin_defer_bio(tc, bio);
				957
				958	while ((bio = bio_list_pop(&info.issue_bios)))
				959	remap_and_issue(info.tc, bio, block);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	960	}
				961
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	962	static void process_prepared_mapping_fail(struct dm_thin_new_mapping *m)
				963	{
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	964	cell_error(m->tc->pool, m->cell);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	965	list_del(&m->list);
				966	mempool_free(m, m->tc->pool->mapping_pool);
				967	}
Joe Thornber	025b968	2013-03-01 22:45:50 +0000	[diff] [blame]	968
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	969	static void process_prepared_mapping(struct dm_thin_new_mapping *m)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	970	{
				971	struct thin_c *tc = m->tc;
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	972	struct pool *pool = tc->pool;
Mike Snitzer	8b908f8	2015-05-13 17:53:13 -0400	[diff] [blame]	973	struct bio *bio = m->bio;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	974	int r;
				975
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	976	if (m->err) {
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	977	cell_error(pool, m->cell);
Joe Thornber	905386f	2012-07-27 15:08:05 +0100	[diff] [blame]	978	goto out;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	979	}
				980
				981	/*
				982	* Commit the prepared block into the mapping btree.
				983	* Any I/O for this block arriving after this point will get
				984	* remapped to it directly.
				985	*/
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	986	r = dm_thin_insert_block(tc->td, m->virt_begin, m->data_block);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	987	if (r) {
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	988	metadata_operation_failed(pool, "dm_thin_insert_block", r);
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	989	cell_error(pool, m->cell);
Joe Thornber	905386f	2012-07-27 15:08:05 +0100	[diff] [blame]	990	goto out;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	991	}
				992
				993	/*
				994	* Release any bios held while the block was being provisioned.
				995	* If we are processing a write bio that completely covers the block,
				996	* we already processed it so can ignore it now when processing
				997	* the bios in the cell.
				998	*/
				999	if (bio) {
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	1000	inc_remap_and_issue_cell(tc, m->cell, m->data_block);
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1001	bio_endio(bio);
Joe Thornber	2d759a4	2014-10-10 15:27:16 +0100	[diff] [blame]	1002	} else {
				1003	inc_all_io_entry(tc->pool, m->cell->holder);
				1004	remap_and_issue(tc, m->cell->holder, m->data_block);
				1005	inc_remap_and_issue_cell(tc, m->cell, m->data_block);
				1006	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1007
Joe Thornber	905386f	2012-07-27 15:08:05 +0100	[diff] [blame]	1008	out:
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1009	list_del(&m->list);
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1010	mempool_free(m, pool->mapping_pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1011	}
				1012
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1013	/----------------------------------------------------------------/
				1014
				1015	static void free_discard_mapping(struct dm_thin_new_mapping *m)
				1016	{
				1017	struct thin_c *tc = m->tc;
				1018	if (m->cell)
				1019	cell_defer_no_holder(tc, m->cell);
				1020	mempool_free(m, tc->pool->mapping_pool);
				1021	}
				1022
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1023	static void process_prepared_discard_fail(struct dm_thin_new_mapping *m)
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1024	{
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1025	bio_io_error(m->bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1026	free_discard_mapping(m);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1027	}
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1028
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1029	static void process_prepared_discard_success(struct dm_thin_new_mapping *m)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1030	{
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1031	bio_endio(m->bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1032	free_discard_mapping(m);
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1033	}
				1034
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1035	static void process_prepared_discard_no_passdown(struct dm_thin_new_mapping *m)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1036	{
				1037	int r;
				1038	struct thin_c *tc = m->tc;
				1039
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1040	r = dm_thin_remove_range(tc->td, m->cell->key.block_begin, m->cell->key.block_end);
				1041	if (r) {
				1042	metadata_operation_failed(tc->pool, "dm_thin_remove_range", r);
				1043	bio_io_error(m->bio);
				1044	} else
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1045	bio_endio(m->bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1046
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1047	cell_defer_no_holder(tc, m->cell);
				1048	mempool_free(m, tc->pool->mapping_pool);
				1049	}
				1050
				1051	static int passdown_double_checking_shared_status(struct dm_thin_new_mapping *m)
				1052	{
				1053	/*
				1054	* We've already unmapped this range of blocks, but before we
				1055	* passdown we have to check that these blocks are now unused.
				1056	*/
				1057	int r;
				1058	bool used = true;
				1059	struct thin_c *tc = m->tc;
				1060	struct pool *pool = tc->pool;
				1061	dm_block_t b = m->data_block, e, end = m->data_block + m->virt_end - m->virt_begin;
				1062
				1063	while (b != end) {
				1064	/* find start of unmapped run */
				1065	for (; b < end; b++) {
				1066	r = dm_pool_block_is_used(pool->pmd, b, &used);
				1067	if (r)
				1068	return r;
				1069
				1070	if (!used)
				1071	break;
				1072	}
				1073
				1074	if (b == end)
				1075	break;
				1076
				1077	/* find end of run */
				1078	for (e = b + 1; e != end; e++) {
				1079	r = dm_pool_block_is_used(pool->pmd, e, &used);
				1080	if (r)
				1081	return r;
				1082
				1083	if (used)
				1084	break;
				1085	}
				1086
				1087	r = issue_discard(tc, b, e, m->bio);
				1088	if (r)
				1089	return r;
				1090
				1091	b = e;
				1092	}
				1093
				1094	return 0;
				1095	}
				1096
				1097	static void process_prepared_discard_passdown(struct dm_thin_new_mapping *m)
				1098	{
				1099	int r;
				1100	struct thin_c *tc = m->tc;
				1101	struct pool *pool = tc->pool;
				1102
				1103	r = dm_thin_remove_range(tc->td, m->virt_begin, m->virt_end);
				1104	if (r)
				1105	metadata_operation_failed(pool, "dm_thin_remove_range", r);
				1106
				1107	else if (m->maybe_shared)
				1108	r = passdown_double_checking_shared_status(m);
				1109	else
				1110	r = issue_discard(tc, m->data_block, m->data_block + (m->virt_end - m->virt_begin), m->bio);
				1111
				1112	/*
				1113	* Even if r is set, there could be sub discards in flight that we
				1114	* need to wait for.
				1115	*/
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1116	m->bio->bi_error = r;
				1117	bio_endio(m->bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1118	cell_defer_no_holder(tc, m->cell);
				1119	mempool_free(m, pool->mapping_pool);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1120	}
				1121
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1122	static void process_prepared(struct pool pool, struct list_head head,
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1123	process_mapping_fn *fn)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1124	{
				1125	unsigned long flags;
				1126	struct list_head maps;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1127	struct dm_thin_new_mapping m, tmp;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1128
				1129	INIT_LIST_HEAD(&maps);
				1130	spin_lock_irqsave(&pool->lock, flags);
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1131	list_splice_init(head, &maps);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1132	spin_unlock_irqrestore(&pool->lock, flags);
				1133
				1134	list_for_each_entry_safe(m, tmp, &maps, list)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1135	(*fn)(m);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1136	}
				1137
				1138	/*
				1139	* Deferred bio jobs.
				1140	*/
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1141	static int io_overlaps_block(struct pool pool, struct bio bio)
				1142	{
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	1143	return bio->bi_iter.bi_size ==
				1144	(pool->sectors_per_block << SECTOR_SHIFT);
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1145	}
				1146
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1147	static int io_overwrites_block(struct pool pool, struct bio bio)
				1148	{
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1149	return (bio_data_dir(bio) == WRITE) &&
				1150	io_overlaps_block(pool, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1151	}
				1152
				1153	static void save_and_set_endio(struct bio bio, bio_end_io_t *save,
				1154	bio_end_io_t *fn)
				1155	{
				1156	*save = bio->bi_end_io;
				1157	bio->bi_end_io = fn;
				1158	}
				1159
				1160	static int ensure_next_mapping(struct pool *pool)
				1161	{
				1162	if (pool->next_mapping)
				1163	return 0;
				1164
				1165	pool->next_mapping = mempool_alloc(pool->mapping_pool, GFP_ATOMIC);
				1166
				1167	return pool->next_mapping ? 0 : -ENOMEM;
				1168	}
				1169
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1170	static struct dm_thin_new_mapping get_next_mapping(struct pool pool)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1171	{
Mike Snitzer	16961b0	2013-12-17 13:19:11 -0500	[diff] [blame]	1172	struct dm_thin_new_mapping *m = pool->next_mapping;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1173
				1174	BUG_ON(!pool->next_mapping);
				1175
Mike Snitzer	16961b0	2013-12-17 13:19:11 -0500	[diff] [blame]	1176	memset(m, 0, sizeof(struct dm_thin_new_mapping));
				1177	INIT_LIST_HEAD(&m->list);
				1178	m->bio = NULL;
				1179
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1180	pool->next_mapping = NULL;
				1181
Mike Snitzer	16961b0	2013-12-17 13:19:11 -0500	[diff] [blame]	1182	return m;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1183	}
				1184
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1185	static void ll_zero(struct thin_c tc, struct dm_thin_new_mapping m,
				1186	sector_t begin, sector_t end)
				1187	{
				1188	int r;
				1189	struct dm_io_region to;
				1190
				1191	to.bdev = tc->pool_dev->bdev;
				1192	to.sector = begin;
				1193	to.count = end - begin;
				1194
				1195	r = dm_kcopyd_zero(tc->pool->copier, 1, &to, 0, copy_complete, m);
				1196	if (r < 0) {
				1197	DMERR_LIMIT("dm_kcopyd_zero() failed");
				1198	copy_complete(1, 1, m);
				1199	}
				1200	}
				1201
Mike Snitzer	452d7a6	2014-10-09 19:20:21 -0400	[diff] [blame]	1202	static void remap_and_issue_overwrite(struct thin_c tc, struct bio bio,
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1203	dm_block_t data_begin,
Mike Snitzer	452d7a6	2014-10-09 19:20:21 -0400	[diff] [blame]	1204	struct dm_thin_new_mapping *m)
				1205	{
				1206	struct pool *pool = tc->pool;
				1207	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
				1208
				1209	h->overwrite_mapping = m;
				1210	m->bio = bio;
				1211	save_and_set_endio(bio, &m->saved_bi_end_io, overwrite_endio);
				1212	inc_all_io_entry(pool, bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1213	remap_and_issue(tc, bio, data_begin);
Mike Snitzer	452d7a6	2014-10-09 19:20:21 -0400	[diff] [blame]	1214	}
				1215
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1216	/*
				1217	* A partial copy also needs to zero the uncopied region.
				1218	*/
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1219	static void schedule_copy(struct thin_c *tc, dm_block_t virt_block,
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1220	struct dm_dev *origin, dm_block_t data_origin,
				1221	dm_block_t data_dest,
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1222	struct dm_bio_prison_cell cell, struct bio bio,
				1223	sector_t len)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1224	{
				1225	int r;
				1226	struct pool *pool = tc->pool;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1227	struct dm_thin_new_mapping *m = get_next_mapping(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1228
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1229	m->tc = tc;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1230	m->virt_begin = virt_block;
				1231	m->virt_end = virt_block + 1u;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1232	m->data_block = data_dest;
				1233	m->cell = cell;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1234
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1235	/*
				1236	* quiesce action + copy action + an extra reference held for the
				1237	* duration of this function (we may need to inc later for a
				1238	* partial zero).
				1239	*/
				1240	atomic_set(&m->prepare_actions, 3);
				1241
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	1242	if (!dm_deferred_set_add_work(pool->shared_read_ds, &m->list))
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1243	complete_mapping_preparation(m); /* already quiesced */
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1244
				1245	/*
				1246	* IO to pool_dev remaps to the pool target's data_dev.
				1247	*
				1248	* If the whole block of data is being overwritten, we can issue the
				1249	* bio immediately. Otherwise we use kcopyd to clone the data first.
				1250	*/
Mike Snitzer	452d7a6	2014-10-09 19:20:21 -0400	[diff] [blame]	1251	if (io_overwrites_block(pool, bio))
				1252	remap_and_issue_overwrite(tc, bio, data_dest, m);
				1253	else {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1254	struct dm_io_region from, to;
				1255
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1256	from.bdev = origin->bdev;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1257	from.sector = data_origin * pool->sectors_per_block;
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1258	from.count = len;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1259
				1260	to.bdev = tc->pool_dev->bdev;
				1261	to.sector = data_dest * pool->sectors_per_block;
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1262	to.count = len;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1263
				1264	r = dm_kcopyd_copy(pool->copier, &from, 1, &to,
				1265	0, copy_complete, m);
				1266	if (r < 0) {
Mike Snitzer	c397741	2012-12-21 20:23:34 +0000	[diff] [blame]	1267	DMERR_LIMIT("dm_kcopyd_copy() failed");
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1268	copy_complete(1, 1, m);
				1269
				1270	/*
				1271	* We allow the zero to be issued, to simplify the
				1272	* error path. Otherwise we'd need to start
				1273	* worrying about decrementing the prepare_actions
				1274	* counter.
				1275	*/
				1276	}
				1277
				1278	/*
				1279	* Do we need to zero a tail region?
				1280	*/
				1281	if (len < pool->sectors_per_block && pool->pf.zero_new_blocks) {
				1282	atomic_inc(&m->prepare_actions);
				1283	ll_zero(tc, m,
				1284	data_dest * pool->sectors_per_block + len,
				1285	(data_dest + 1) * pool->sectors_per_block);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1286	}
				1287	}
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1288
				1289	complete_mapping_preparation(m); /* drop our ref */
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1290	}
				1291
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1292	static void schedule_internal_copy(struct thin_c *tc, dm_block_t virt_block,
				1293	dm_block_t data_origin, dm_block_t data_dest,
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1294	struct dm_bio_prison_cell cell, struct bio bio)
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1295	{
				1296	schedule_copy(tc, virt_block, tc->pool_dev,
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1297	data_origin, data_dest, cell, bio,
				1298	tc->pool->sectors_per_block);
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1299	}
				1300
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1301	static void schedule_zero(struct thin_c *tc, dm_block_t virt_block,
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1302	dm_block_t data_block, struct dm_bio_prison_cell *cell,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1303	struct bio *bio)
				1304	{
				1305	struct pool *pool = tc->pool;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1306	struct dm_thin_new_mapping *m = get_next_mapping(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1307
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	1308	atomic_set(&m->prepare_actions, 1); /* no need to quiesce */
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1309	m->tc = tc;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1310	m->virt_begin = virt_block;
				1311	m->virt_end = virt_block + 1u;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1312	m->data_block = data_block;
				1313	m->cell = cell;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1314
				1315	/*
				1316	* If the whole block of data is being overwritten or we are not
				1317	* zeroing pre-existing data, we can issue the bio immediately.
				1318	* Otherwise we use kcopyd to zero the data first.
				1319	*/
Mike Snitzer	f8ae752	2015-05-14 11:28:37 -0400	[diff] [blame]	1320	if (pool->pf.zero_new_blocks) {
				1321	if (io_overwrites_block(pool, bio))
				1322	remap_and_issue_overwrite(tc, bio, data_block, m);
				1323	else
				1324	ll_zero(tc, m, data_block * pool->sectors_per_block,
				1325	(data_block + 1) * pool->sectors_per_block);
				1326	} else
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1327	process_prepared_mapping(m);
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1328	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1329
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1330	static void schedule_external_copy(struct thin_c *tc, dm_block_t virt_block,
				1331	dm_block_t data_dest,
				1332	struct dm_bio_prison_cell cell, struct bio bio)
				1333	{
				1334	struct pool *pool = tc->pool;
				1335	sector_t virt_block_begin = virt_block * pool->sectors_per_block;
				1336	sector_t virt_block_end = (virt_block + 1) * pool->sectors_per_block;
				1337
				1338	if (virt_block_end <= tc->origin_size)
				1339	schedule_copy(tc, virt_block, tc->origin_dev,
				1340	virt_block, data_dest, cell, bio,
				1341	pool->sectors_per_block);
				1342
				1343	else if (virt_block_begin < tc->origin_size)
				1344	schedule_copy(tc, virt_block, tc->origin_dev,
				1345	virt_block, data_dest, cell, bio,
				1346	tc->origin_size - virt_block_begin);
				1347
				1348	else
				1349	schedule_zero(tc, virt_block, data_dest, cell, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1350	}
				1351
Joe Thornber	2c43fd2	2014-12-11 11:12:19 +0000	[diff] [blame]	1352	static void set_pool_mode(struct pool *pool, enum pool_mode new_mode);
				1353
				1354	static void check_for_space(struct pool *pool)
				1355	{
				1356	int r;
				1357	dm_block_t nr_free;
				1358
				1359	if (get_pool_mode(pool) != PM_OUT_OF_DATA_SPACE)
				1360	return;
				1361
				1362	r = dm_pool_get_free_block_count(pool->pmd, &nr_free);
				1363	if (r)
				1364	return;
				1365
				1366	if (nr_free)
				1367	set_pool_mode(pool, PM_WRITE);
				1368	}
				1369
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1370	/*
				1371	* A non-zero return indicates read_only or fail_io mode.
				1372	* Many callers don't care about the return value.
				1373	*/
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	1374	static int commit(struct pool *pool)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1375	{
				1376	int r;
				1377
Joe Thornber	8d07e8a	2014-05-06 16:28:14 +0100	[diff] [blame]	1378	if (get_pool_mode(pool) >= PM_READ_ONLY)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1379	return -EINVAL;
				1380
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	1381	r = dm_pool_commit_metadata(pool->pmd);
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1382	if (r)
				1383	metadata_operation_failed(pool, "dm_pool_commit_metadata", r);
Joe Thornber	2c43fd2	2014-12-11 11:12:19 +0000	[diff] [blame]	1384	else
				1385	check_for_space(pool);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1386
				1387	return r;
				1388	}
				1389
Joe Thornber	88a6621	2013-12-04 20:16:12 -0500	[diff] [blame]	1390	static void check_low_water_mark(struct pool *pool, dm_block_t free_blocks)
				1391	{
				1392	unsigned long flags;
				1393
				1394	if (free_blocks <= pool->low_water_blocks && !pool->low_water_triggered) {
				1395	DMWARN("%s: reached low water mark for data device: sending event.",
				1396	dm_device_name(pool->pool_md));
				1397	spin_lock_irqsave(&pool->lock, flags);
				1398	pool->low_water_triggered = true;
				1399	spin_unlock_irqrestore(&pool->lock, flags);
				1400	dm_table_event(pool->ti->table);
				1401	}
				1402	}
				1403
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1404	static int alloc_data_block(struct thin_c tc, dm_block_t result)
				1405	{
				1406	int r;
				1407	dm_block_t free_blocks;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1408	struct pool *pool = tc->pool;
				1409
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1410	if (WARN_ON(get_pool_mode(pool) != PM_WRITE))
Joe Thornber	8d30abf	2013-12-04 19:16:11 -0500	[diff] [blame]	1411	return -EINVAL;
				1412
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1413	r = dm_pool_get_free_block_count(pool->pmd, &free_blocks);
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1414	if (r) {
				1415	metadata_operation_failed(pool, "dm_pool_get_free_block_count", r);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1416	return r;
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1417	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1418
Joe Thornber	88a6621	2013-12-04 20:16:12 -0500	[diff] [blame]	1419	check_low_water_mark(pool, free_blocks);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1420
				1421	if (!free_blocks) {
Mike Snitzer	94563ba	2013-08-22 09:56:18 -0400	[diff] [blame]	1422	/*
				1423	* Try to commit to see if that will free up some
				1424	* more space.
				1425	*/
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	1426	r = commit(pool);
				1427	if (r)
				1428	return r;
Mike Snitzer	94563ba	2013-08-22 09:56:18 -0400	[diff] [blame]	1429
				1430	r = dm_pool_get_free_block_count(pool->pmd, &free_blocks);
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1431	if (r) {
				1432	metadata_operation_failed(pool, "dm_pool_get_free_block_count", r);
Mike Snitzer	94563ba	2013-08-22 09:56:18 -0400	[diff] [blame]	1433	return r;
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1434	}
Mike Snitzer	94563ba	2013-08-22 09:56:18 -0400	[diff] [blame]	1435
Mike Snitzer	94563ba	2013-08-22 09:56:18 -0400	[diff] [blame]	1436	if (!free_blocks) {
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1437	set_pool_mode(pool, PM_OUT_OF_DATA_SPACE);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1438	return -ENOSPC;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1439	}
				1440	}
				1441
				1442	r = dm_pool_alloc_data_block(pool->pmd, result);
Mike Snitzer	4a02b34	2013-12-03 12:20:57 -0500	[diff] [blame]	1443	if (r) {
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	1444	metadata_operation_failed(pool, "dm_pool_alloc_data_block", r);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1445	return r;
Mike Snitzer	4a02b34	2013-12-03 12:20:57 -0500	[diff] [blame]	1446	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1447
				1448	return 0;
				1449	}
				1450
				1451	/*
				1452	* If we have run out of space, queue bios until the device is
				1453	* resumed, presumably after having been reloaded with more space.
				1454	*/
				1455	static void retry_on_resume(struct bio *bio)
				1456	{
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	1457	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	1458	struct thin_c *tc = h->tc;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1459	unsigned long flags;
				1460
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	1461	spin_lock_irqsave(&tc->lock, flags);
				1462	bio_list_add(&tc->retry_on_resume_list, bio);
				1463	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1464	}
				1465
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1466	static int should_error_unserviceable_bio(struct pool *pool)
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1467	{
				1468	enum pool_mode m = get_pool_mode(pool);
				1469
				1470	switch (m) {
				1471	case PM_WRITE:
				1472	/* Shouldn't get here */
				1473	DMERR_LIMIT("bio unserviceable, yet pool is in PM_WRITE mode");
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1474	return -EIO;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1475
				1476	case PM_OUT_OF_DATA_SPACE:
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1477	return pool->pf.error_if_no_space ? -ENOSPC : 0;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1478
				1479	case PM_READ_ONLY:
				1480	case PM_FAIL:
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1481	return -EIO;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1482	default:
				1483	/* Shouldn't get here */
				1484	DMERR_LIMIT("bio unserviceable, yet pool has an unknown mode");
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1485	return -EIO;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1486	}
				1487	}
				1488
Mike Snitzer	8c0f0e8	2013-12-05 15:47:24 -0500	[diff] [blame]	1489	static void handle_unserviceable_bio(struct pool pool, struct bio bio)
				1490	{
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1491	int error = should_error_unserviceable_bio(pool);
				1492
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1493	if (error) {
				1494	bio->bi_error = error;
				1495	bio_endio(bio);
				1496	} else
Mike Snitzer	6d16202	2013-12-20 18:09:02 -0500	[diff] [blame]	1497	retry_on_resume(bio);
Mike Snitzer	8c0f0e8	2013-12-05 15:47:24 -0500	[diff] [blame]	1498	}
				1499
Mike Snitzer	399cadd	2013-12-05 16:03:33 -0500	[diff] [blame]	1500	static void retry_bios_on_resume(struct pool pool, struct dm_bio_prison_cell cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1501	{
				1502	struct bio *bio;
				1503	struct bio_list bios;
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1504	int error;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1505
Mike Snitzer	af91805	2014-05-22 14:32:51 -0400	[diff] [blame]	1506	error = should_error_unserviceable_bio(pool);
				1507	if (error) {
				1508	cell_error_with_code(pool, cell, error);
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1509	return;
				1510	}
				1511
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1512	bio_list_init(&bios);
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1513	cell_release(pool, cell, &bios);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1514
Mike Snitzer	9d094ee	2014-10-19 08:23:09 -0400	[diff] [blame]	1515	while ((bio = bio_list_pop(&bios)))
				1516	retry_on_resume(bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1517	}
				1518
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1519	static void process_discard_cell_no_passdown(struct thin_c *tc,
				1520	struct dm_bio_prison_cell *virt_cell)
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1521	{
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1522	struct pool *pool = tc->pool;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1523	struct dm_thin_new_mapping *m = get_next_mapping(pool);
				1524
				1525	/*
				1526	* We don't need to lock the data blocks, since there's no
				1527	* passdown. We only lock data blocks for allocation and breaking sharing.
				1528	*/
				1529	m->tc = tc;
				1530	m->virt_begin = virt_cell->key.block_begin;
				1531	m->virt_end = virt_cell->key.block_end;
				1532	m->cell = virt_cell;
				1533	m->bio = virt_cell->holder;
				1534
				1535	if (!dm_deferred_set_add_work(pool->all_io_ds, &m->list))
				1536	pool->process_prepared_discard(m);
				1537	}
				1538
				1539	/*
				1540	* FIXME: DM local hack to defer parent bios's end_io until we
				1541	* _know_ all chained sub range discard bios have completed.
				1542	* Will go away once late bio splitting lands upstream!
				1543	*/
				1544	static inline void __bio_inc_remaining(struct bio *bio)
				1545	{
				1546	bio->bi_flags \|= (1 << BIO_CHAIN);
				1547	smp_mb__before_atomic();
				1548	atomic_inc(&bio->__bi_remaining);
				1549	}
				1550
				1551	static void break_up_discard_bio(struct thin_c *tc, dm_block_t begin, dm_block_t end,
				1552	struct bio *bio)
				1553	{
				1554	struct pool *pool = tc->pool;
				1555
				1556	int r;
				1557	bool maybe_shared;
				1558	struct dm_cell_key data_key;
				1559	struct dm_bio_prison_cell *data_cell;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1560	struct dm_thin_new_mapping *m;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1561	dm_block_t virt_begin, virt_end, data_begin;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1562
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1563	while (begin != end) {
				1564	r = ensure_next_mapping(pool);
				1565	if (r)
				1566	/* we did our best */
				1567	return;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1568
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1569	r = dm_thin_find_mapped_range(tc->td, begin, end, &virt_begin, &virt_end,
				1570	&data_begin, &maybe_shared);
				1571	if (r)
				1572	/*
				1573	* Silently fail, letting any mappings we've
				1574	* created complete.
				1575	*/
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1576	break;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1577
				1578	build_key(tc->td, PHYSICAL, data_begin, data_begin + (virt_end - virt_begin), &data_key);
				1579	if (bio_detain(tc->pool, &data_key, NULL, &data_cell)) {
				1580	/* contention, we'll give up with this range */
				1581	begin = virt_end;
				1582	continue;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1583	}
				1584
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1585	/*
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1586	* IO may still be going to the destination block. We must
				1587	* quiesce before we can do the removal.
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1588	*/
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1589	m = get_next_mapping(pool);
				1590	m->tc = tc;
				1591	m->maybe_shared = maybe_shared;
				1592	m->virt_begin = virt_begin;
				1593	m->virt_end = virt_end;
				1594	m->data_block = data_begin;
				1595	m->cell = data_cell;
				1596	m->bio = bio;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1597
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1598	/*
				1599	* The parent bio must not complete before sub discard bios are
				1600	* chained to it (see __blkdev_issue_discard_async's bio_chain)!
				1601	*
				1602	* This per-mapping bi_remaining increment is paired with
				1603	* the implicit decrement that occurs via bio_endio() in
				1604	* process_prepared_discard_{passdown,no_passdown}.
				1605	*/
				1606	__bio_inc_remaining(bio);
				1607	if (!dm_deferred_set_add_work(pool->all_io_ds, &m->list))
				1608	pool->process_prepared_discard(m);
				1609
				1610	begin = virt_end;
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	1611	}
				1612	}
				1613
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1614	static void process_discard_cell_passdown(struct thin_c tc, struct dm_bio_prison_cell virt_cell)
				1615	{
				1616	struct bio *bio = virt_cell->holder;
				1617	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
				1618
				1619	/*
				1620	* The virt_cell will only get freed once the origin bio completes.
				1621	* This means it will remain locked while all the individual
				1622	* passdown bios are in flight.
				1623	*/
				1624	h->cell = virt_cell;
				1625	break_up_discard_bio(tc, virt_cell->key.block_begin, virt_cell->key.block_end, bio);
				1626
				1627	/*
				1628	* We complete the bio now, knowing that the bi_remaining field
				1629	* will prevent completion until the sub range discards have
				1630	* completed.
				1631	*/
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1632	bio_endio(bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1633	}
				1634
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1635	static void process_discard_bio(struct thin_c tc, struct bio bio)
				1636	{
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1637	dm_block_t begin, end;
				1638	struct dm_cell_key virt_key;
				1639	struct dm_bio_prison_cell *virt_cell;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1640
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1641	get_bio_block_range(tc, bio, &begin, &end);
				1642	if (begin == end) {
				1643	/*
				1644	* The discard covers less than a block.
				1645	*/
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1646	bio_endio(bio);
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1647	return;
				1648	}
				1649
				1650	build_key(tc->td, VIRTUAL, begin, end, &virt_key);
				1651	if (bio_detain(tc->pool, &virt_key, bio, &virt_cell))
				1652	/*
				1653	* Potential starvation issue: We're relying on the
				1654	* fs/application being well behaved, and not trying to
				1655	* send IO to a region at the same time as discarding it.
				1656	* If they do this persistently then it's possible this
				1657	* cell will never be granted.
				1658	*/
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1659	return;
				1660
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	1661	tc->pool->process_discard_cell(tc, virt_cell);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1662	}
				1663
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1664	static void break_sharing(struct thin_c tc, struct bio bio, dm_block_t block,
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	1665	struct dm_cell_key *key,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1666	struct dm_thin_lookup_result *lookup_result,
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1667	struct dm_bio_prison_cell *cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1668	{
				1669	int r;
				1670	dm_block_t data_block;
Mike Snitzer	d6fc204	2013-08-21 17:40:11 -0400	[diff] [blame]	1671	struct pool *pool = tc->pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1672
				1673	r = alloc_data_block(tc, &data_block);
				1674	switch (r) {
				1675	case 0:
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1676	schedule_internal_copy(tc, block, lookup_result->block,
				1677	data_block, cell, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1678	break;
				1679
				1680	case -ENOSPC:
Mike Snitzer	399cadd	2013-12-05 16:03:33 -0500	[diff] [blame]	1681	retry_bios_on_resume(pool, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1682	break;
				1683
				1684	default:
Mike Snitzer	c397741	2012-12-21 20:23:34 +0000	[diff] [blame]	1685	DMERR_LIMIT("%s: alloc_data_block() failed: error = %d",
				1686	__func__, r);
Mike Snitzer	d6fc204	2013-08-21 17:40:11 -0400	[diff] [blame]	1687	cell_error(pool, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1688	break;
				1689	}
				1690	}
				1691
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1692	static void __remap_and_issue_shared_cell(void *context,
				1693	struct dm_bio_prison_cell *cell)
				1694	{
				1695	struct remap_info *info = context;
				1696	struct bio *bio;
				1697
				1698	while ((bio = bio_list_pop(&cell->bios))) {
				1699	if ((bio_data_dir(bio) == WRITE) \|\|
				1700	(bio->bi_rw & (REQ_DISCARD \| REQ_FLUSH \| REQ_FUA)))
				1701	bio_list_add(&info->defer_bios, bio);
				1702	else {
				1703	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));;
				1704
				1705	h->shared_read_entry = dm_deferred_entry_inc(info->tc->pool->shared_read_ds);
				1706	inc_all_io_entry(info->tc->pool, bio);
				1707	bio_list_add(&info->issue_bios, bio);
				1708	}
				1709	}
				1710	}
				1711
				1712	static void remap_and_issue_shared_cell(struct thin_c *tc,
				1713	struct dm_bio_prison_cell *cell,
				1714	dm_block_t block)
				1715	{
				1716	struct bio *bio;
				1717	struct remap_info info;
				1718
				1719	info.tc = tc;
				1720	bio_list_init(&info.defer_bios);
				1721	bio_list_init(&info.issue_bios);
				1722
				1723	cell_visit_release(tc->pool, __remap_and_issue_shared_cell,
				1724	&info, cell);
				1725
				1726	while ((bio = bio_list_pop(&info.defer_bios)))
				1727	thin_defer_bio(tc, bio);
				1728
				1729	while ((bio = bio_list_pop(&info.issue_bios)))
				1730	remap_and_issue(tc, bio, block);
				1731	}
				1732
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1733	static void process_shared_bio(struct thin_c tc, struct bio bio,
				1734	dm_block_t block,
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1735	struct dm_thin_lookup_result *lookup_result,
				1736	struct dm_bio_prison_cell *virt_cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1737	{
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1738	struct dm_bio_prison_cell *data_cell;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1739	struct pool *pool = tc->pool;
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	1740	struct dm_cell_key key;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1741
				1742	/*
				1743	* If cell is already occupied, then sharing is already in the process
				1744	* of being broken so we have nothing further to do here.
				1745	*/
				1746	build_data_key(tc->td, lookup_result->block, &key);
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1747	if (bio_detain(pool, &key, bio, &data_cell)) {
				1748	cell_defer_no_holder(tc, virt_cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1749	return;
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1750	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1751
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1752	if (bio_data_dir(bio) == WRITE && bio->bi_iter.bi_size) {
				1753	break_sharing(tc, bio, block, &key, lookup_result, data_cell);
				1754	cell_defer_no_holder(tc, virt_cell);
				1755	} else {
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	1756	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1757
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	1758	h->shared_read_entry = dm_deferred_entry_inc(pool->shared_read_ds);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1759	inc_all_io_entry(pool, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1760	remap_and_issue(tc, bio, lookup_result->block);
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1761
				1762	remap_and_issue_shared_cell(tc, data_cell, lookup_result->block);
				1763	remap_and_issue_shared_cell(tc, virt_cell, lookup_result->block);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1764	}
				1765	}
				1766
				1767	static void provision_block(struct thin_c tc, struct bio bio, dm_block_t block,
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	1768	struct dm_bio_prison_cell *cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1769	{
				1770	int r;
				1771	dm_block_t data_block;
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1772	struct pool *pool = tc->pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1773
				1774	/*
				1775	* Remap empty bios (flushes) immediately, without provisioning.
				1776	*/
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	1777	if (!bio->bi_iter.bi_size) {
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1778	inc_all_io_entry(pool, bio);
Joe Thornber	f286ba0	2012-12-21 20:23:33 +0000	[diff] [blame]	1779	cell_defer_no_holder(tc, cell);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1780
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1781	remap_and_issue(tc, bio, 0);
				1782	return;
				1783	}
				1784
				1785	/*
				1786	* Fill read bios with zeroes and complete them immediately.
				1787	*/
				1788	if (bio_data_dir(bio) == READ) {
				1789	zero_fill_bio(bio);
Joe Thornber	f286ba0	2012-12-21 20:23:33 +0000	[diff] [blame]	1790	cell_defer_no_holder(tc, cell);
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1791	bio_endio(bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1792	return;
				1793	}
				1794
				1795	r = alloc_data_block(tc, &data_block);
				1796	switch (r) {
				1797	case 0:
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1798	if (tc->origin_dev)
				1799	schedule_external_copy(tc, block, data_block, cell, bio);
				1800	else
				1801	schedule_zero(tc, block, data_block, cell, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1802	break;
				1803
				1804	case -ENOSPC:
Mike Snitzer	399cadd	2013-12-05 16:03:33 -0500	[diff] [blame]	1805	retry_bios_on_resume(pool, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1806	break;
				1807
				1808	default:
Mike Snitzer	c397741	2012-12-21 20:23:34 +0000	[diff] [blame]	1809	DMERR_LIMIT("%s: alloc_data_block() failed: error = %d",
				1810	__func__, r);
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1811	cell_error(pool, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1812	break;
				1813	}
				1814	}
				1815
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1816	static void process_cell(struct thin_c tc, struct dm_bio_prison_cell cell)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1817	{
				1818	int r;
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1819	struct pool *pool = tc->pool;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1820	struct bio *bio = cell->holder;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1821	dm_block_t block = get_bio_block(tc, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1822	struct dm_thin_lookup_result lookup_result;
				1823
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1824	if (tc->requeue_mode) {
				1825	cell_requeue(pool, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1826	return;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1827	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1828
				1829	r = dm_thin_find_block(tc->td, block, 1, &lookup_result);
				1830	switch (r) {
				1831	case 0:
Joe Thornber	23ca2bb	2014-10-15 14:46:58 +0100	[diff] [blame]	1832	if (lookup_result.shared)
				1833	process_shared_bio(tc, bio, block, &lookup_result, cell);
				1834	else {
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1835	inc_all_io_entry(pool, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1836	remap_and_issue(tc, bio, lookup_result.block);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1837	inc_remap_and_issue_cell(tc, cell, lookup_result.block);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1838	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1839	break;
				1840
				1841	case -ENODATA:
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1842	if (bio_data_dir(bio) == READ && tc->origin_dev) {
Joe Thornber	6beca5e	2013-03-01 22:45:50 +0000	[diff] [blame]	1843	inc_all_io_entry(pool, bio);
Joe Thornber	f286ba0	2012-12-21 20:23:33 +0000	[diff] [blame]	1844	cell_defer_no_holder(tc, cell);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1845
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1846	if (bio_end_sector(bio) <= tc->origin_size)
				1847	remap_to_origin_and_issue(tc, bio);
				1848
				1849	else if (bio->bi_iter.bi_sector < tc->origin_size) {
				1850	zero_fill_bio(bio);
				1851	bio->bi_iter.bi_size = (tc->origin_size - bio->bi_iter.bi_sector) << SECTOR_SHIFT;
				1852	remap_to_origin_and_issue(tc, bio);
				1853
				1854	} else {
				1855	zero_fill_bio(bio);
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1856	bio_endio(bio);
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	1857	}
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	1858	} else
				1859	provision_block(tc, bio, block, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1860	break;
				1861
				1862	default:
Mike Snitzer	c397741	2012-12-21 20:23:34 +0000	[diff] [blame]	1863	DMERR_LIMIT("%s: dm_thin_find_block() failed: error = %d",
				1864	__func__, r);
Joe Thornber	f286ba0	2012-12-21 20:23:33 +0000	[diff] [blame]	1865	cell_defer_no_holder(tc, cell);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	1866	bio_io_error(bio);
				1867	break;
				1868	}
				1869	}
				1870
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1871	static void process_bio(struct thin_c tc, struct bio bio)
				1872	{
				1873	struct pool *pool = tc->pool;
				1874	dm_block_t block = get_bio_block(tc, bio);
				1875	struct dm_bio_prison_cell *cell;
				1876	struct dm_cell_key key;
				1877
				1878	/*
				1879	* If cell is already occupied, then the block is already
				1880	* being provisioned so we have nothing further to do here.
				1881	*/
				1882	build_virtual_key(tc->td, block, &key);
				1883	if (bio_detain(pool, &key, bio, &cell))
				1884	return;
				1885
				1886	process_cell(tc, cell);
				1887	}
				1888
				1889	static void __process_bio_read_only(struct thin_c tc, struct bio bio,
				1890	struct dm_bio_prison_cell *cell)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1891	{
				1892	int r;
				1893	int rw = bio_data_dir(bio);
				1894	dm_block_t block = get_bio_block(tc, bio);
				1895	struct dm_thin_lookup_result lookup_result;
				1896
				1897	r = dm_thin_find_block(tc->td, block, 1, &lookup_result);
				1898	switch (r) {
				1899	case 0:
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1900	if (lookup_result.shared && (rw == WRITE) && bio->bi_iter.bi_size) {
Mike Snitzer	8c0f0e8	2013-12-05 15:47:24 -0500	[diff] [blame]	1901	handle_unserviceable_bio(tc->pool, bio);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1902	if (cell)
				1903	cell_defer_no_holder(tc, cell);
				1904	} else {
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1905	inc_all_io_entry(tc->pool, bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1906	remap_and_issue(tc, bio, lookup_result.block);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1907	if (cell)
				1908	inc_remap_and_issue_cell(tc, cell, lookup_result.block);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1909	}
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1910	break;
				1911
				1912	case -ENODATA:
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1913	if (cell)
				1914	cell_defer_no_holder(tc, cell);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1915	if (rw != READ) {
Mike Snitzer	8c0f0e8	2013-12-05 15:47:24 -0500	[diff] [blame]	1916	handle_unserviceable_bio(tc->pool, bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1917	break;
				1918	}
				1919
				1920	if (tc->origin_dev) {
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	1921	inc_all_io_entry(tc->pool, bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1922	remap_to_origin_and_issue(tc, bio);
				1923	break;
				1924	}
				1925
				1926	zero_fill_bio(bio);
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1927	bio_endio(bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1928	break;
				1929
				1930	default:
Mike Snitzer	c397741	2012-12-21 20:23:34 +0000	[diff] [blame]	1931	DMERR_LIMIT("%s: dm_thin_find_block() failed: error = %d",
				1932	__func__, r);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1933	if (cell)
				1934	cell_defer_no_holder(tc, cell);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1935	bio_io_error(bio);
				1936	break;
				1937	}
				1938	}
				1939
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1940	static void process_bio_read_only(struct thin_c tc, struct bio bio)
				1941	{
				1942	__process_bio_read_only(tc, bio, NULL);
				1943	}
				1944
				1945	static void process_cell_read_only(struct thin_c tc, struct dm_bio_prison_cell cell)
				1946	{
				1947	__process_bio_read_only(tc, cell->holder, cell);
				1948	}
				1949
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1950	static void process_bio_success(struct thin_c tc, struct bio bio)
				1951	{
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	1952	bio_endio(bio);
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	1953	}
				1954
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	1955	static void process_bio_fail(struct thin_c tc, struct bio bio)
				1956	{
				1957	bio_io_error(bio);
				1958	}
				1959
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	1960	static void process_cell_success(struct thin_c tc, struct dm_bio_prison_cell cell)
				1961	{
				1962	cell_success(tc->pool, cell);
				1963	}
				1964
				1965	static void process_cell_fail(struct thin_c tc, struct dm_bio_prison_cell cell)
				1966	{
				1967	cell_error(tc->pool, cell);
				1968	}
				1969
Joe Thornber	ac8c3f3	2013-05-10 14:37:21 +0100	[diff] [blame]	1970	/*
				1971	* FIXME: should we also commit due to size of transaction, measured in
				1972	* metadata blocks?
				1973	*/
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	1974	static int need_commit_due_to_time(struct pool *pool)
				1975	{
Manuel Schölling	0f30af9	2014-05-22 22:42:37 +0200	[diff] [blame]	1976	return !time_in_range(jiffies, pool->last_commit_jiffies,
				1977	pool->last_commit_jiffies + COMMIT_PERIOD);
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	1978	}
				1979
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	1980	#define thin_pbd(node) rb_entry((node), struct dm_thin_endio_hook, rb_node)
				1981	#define thin_bio(pbd) dm_bio_from_per_bio_data((pbd), sizeof(struct dm_thin_endio_hook))
				1982
				1983	static void __thin_bio_rb_add(struct thin_c tc, struct bio bio)
				1984	{
				1985	struct rb_node *rbp, parent;
				1986	struct dm_thin_endio_hook *pbd;
				1987	sector_t bi_sector = bio->bi_iter.bi_sector;
				1988
				1989	rbp = &tc->sort_bio_list.rb_node;
				1990	parent = NULL;
				1991	while (*rbp) {
				1992	parent = *rbp;
				1993	pbd = thin_pbd(parent);
				1994
				1995	if (bi_sector < thin_bio(pbd)->bi_iter.bi_sector)
				1996	rbp = &(*rbp)->rb_left;
				1997	else
				1998	rbp = &(*rbp)->rb_right;
				1999	}
				2000
				2001	pbd = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
				2002	rb_link_node(&pbd->rb_node, parent, rbp);
				2003	rb_insert_color(&pbd->rb_node, &tc->sort_bio_list);
				2004	}
				2005
				2006	static void __extract_sorted_bios(struct thin_c *tc)
				2007	{
				2008	struct rb_node *node;
				2009	struct dm_thin_endio_hook *pbd;
				2010	struct bio *bio;
				2011
				2012	for (node = rb_first(&tc->sort_bio_list); node; node = rb_next(node)) {
				2013	pbd = thin_pbd(node);
				2014	bio = thin_bio(pbd);
				2015
				2016	bio_list_add(&tc->deferred_bio_list, bio);
				2017	rb_erase(&pbd->rb_node, &tc->sort_bio_list);
				2018	}
				2019
				2020	WARN_ON(!RB_EMPTY_ROOT(&tc->sort_bio_list));
				2021	}
				2022
				2023	static void __sort_thin_deferred_bios(struct thin_c *tc)
				2024	{
				2025	struct bio *bio;
				2026	struct bio_list bios;
				2027
				2028	bio_list_init(&bios);
				2029	bio_list_merge(&bios, &tc->deferred_bio_list);
				2030	bio_list_init(&tc->deferred_bio_list);
				2031
				2032	/* Sort deferred_bio_list using rb-tree */
				2033	while ((bio = bio_list_pop(&bios)))
				2034	__thin_bio_rb_add(tc, bio);
				2035
				2036	/*
				2037	* Transfer the sorted bios in sort_bio_list back to
				2038	* deferred_bio_list to allow lockless submission of
				2039	* all bios.
				2040	*/
				2041	__extract_sorted_bios(tc);
				2042	}
				2043
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2044	static void process_thin_deferred_bios(struct thin_c *tc)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2045	{
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2046	struct pool *pool = tc->pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2047	unsigned long flags;
				2048	struct bio *bio;
				2049	struct bio_list bios;
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	2050	struct blk_plug plug;
Joe Thornber	8a01a6a	2014-10-06 15:28:30 +0100	[diff] [blame]	2051	unsigned count = 0;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2052
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2053	if (tc->requeue_mode) {
Mike Snitzer	42d6a8c	2014-10-19 07:52:44 -0400	[diff] [blame]	2054	error_thin_bio_list(tc, &tc->deferred_bio_list, DM_ENDIO_REQUEUE);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2055	return;
				2056	}
				2057
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2058	bio_list_init(&bios);
				2059
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2060	spin_lock_irqsave(&tc->lock, flags);
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	2061
				2062	if (bio_list_empty(&tc->deferred_bio_list)) {
				2063	spin_unlock_irqrestore(&tc->lock, flags);
				2064	return;
				2065	}
				2066
				2067	__sort_thin_deferred_bios(tc);
				2068
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2069	bio_list_merge(&bios, &tc->deferred_bio_list);
				2070	bio_list_init(&tc->deferred_bio_list);
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	2071
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2072	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2073
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	2074	blk_start_plug(&plug);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2075	while ((bio = bio_list_pop(&bios))) {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2076	/*
				2077	* If we've got no free new_mapping structs, and processing
				2078	* this bio might require one, we pause until there are some
				2079	* prepared mappings to process.
				2080	*/
				2081	if (ensure_next_mapping(pool)) {
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2082	spin_lock_irqsave(&tc->lock, flags);
				2083	bio_list_add(&tc->deferred_bio_list, bio);
				2084	bio_list_merge(&tc->deferred_bio_list, &bios);
				2085	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2086	break;
				2087	}
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	2088
				2089	if (bio->bi_rw & REQ_DISCARD)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2090	pool->process_discard(tc, bio);
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	2091	else
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2092	pool->process_bio(tc, bio);
Joe Thornber	8a01a6a	2014-10-06 15:28:30 +0100	[diff] [blame]	2093
				2094	if ((count++ & 127) == 0) {
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2095	throttle_work_update(&pool->throttle);
Joe Thornber	8a01a6a	2014-10-06 15:28:30 +0100	[diff] [blame]	2096	dm_pool_issue_prefetches(pool->pmd);
				2097	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2098	}
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	2099	blk_finish_plug(&plug);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2100	}
				2101
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	2102	static int cmp_cells(const void lhs, const void rhs)
				2103	{
				2104	struct dm_bio_prison_cell lhs_cell = ((struct dm_bio_prison_cell **) lhs);
				2105	struct dm_bio_prison_cell rhs_cell = ((struct dm_bio_prison_cell **) rhs);
				2106
				2107	BUG_ON(!lhs_cell->holder);
				2108	BUG_ON(!rhs_cell->holder);
				2109
				2110	if (lhs_cell->holder->bi_iter.bi_sector < rhs_cell->holder->bi_iter.bi_sector)
				2111	return -1;
				2112
				2113	if (lhs_cell->holder->bi_iter.bi_sector > rhs_cell->holder->bi_iter.bi_sector)
				2114	return 1;
				2115
				2116	return 0;
				2117	}
				2118
				2119	static unsigned sort_cells(struct pool pool, struct list_head cells)
				2120	{
				2121	unsigned count = 0;
				2122	struct dm_bio_prison_cell cell, tmp;
				2123
				2124	list_for_each_entry_safe(cell, tmp, cells, user_list) {
				2125	if (count >= CELL_SORT_ARRAY_SIZE)
				2126	break;
				2127
				2128	pool->cell_sort_array[count++] = cell;
				2129	list_del(&cell->user_list);
				2130	}
				2131
				2132	sort(pool->cell_sort_array, count, sizeof(cell), cmp_cells, NULL);
				2133
				2134	return count;
				2135	}
				2136
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2137	static void process_thin_deferred_cells(struct thin_c *tc)
				2138	{
				2139	struct pool *pool = tc->pool;
				2140	unsigned long flags;
				2141	struct list_head cells;
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	2142	struct dm_bio_prison_cell *cell;
				2143	unsigned i, j, count;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2144
				2145	INIT_LIST_HEAD(&cells);
				2146
				2147	spin_lock_irqsave(&tc->lock, flags);
				2148	list_splice_init(&tc->deferred_cells, &cells);
				2149	spin_unlock_irqrestore(&tc->lock, flags);
				2150
				2151	if (list_empty(&cells))
				2152	return;
				2153
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	2154	do {
				2155	count = sort_cells(tc->pool, &cells);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2156
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	2157	for (i = 0; i < count; i++) {
				2158	cell = pool->cell_sort_array[i];
				2159	BUG_ON(!cell->holder);
				2160
				2161	/*
				2162	* If we've got no free new_mapping structs, and processing
				2163	* this bio might require one, we pause until there are some
				2164	* prepared mappings to process.
				2165	*/
				2166	if (ensure_next_mapping(pool)) {
				2167	for (j = i; j < count; j++)
				2168	list_add(&pool->cell_sort_array[j]->user_list, &cells);
				2169
				2170	spin_lock_irqsave(&tc->lock, flags);
				2171	list_splice(&cells, &tc->deferred_cells);
				2172	spin_unlock_irqrestore(&tc->lock, flags);
				2173	return;
				2174	}
				2175
				2176	if (cell->holder->bi_rw & REQ_DISCARD)
				2177	pool->process_discard_cell(tc, cell);
				2178	else
				2179	pool->process_cell(tc, cell);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2180	}
Joe Thornber	ac4c3f3	2014-10-10 16:42:10 +0100	[diff] [blame]	2181	} while (!list_empty(&cells));
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2182	}
				2183
Joe Thornber	b10ebd3	2014-04-08 11:29:01 +0100	[diff] [blame]	2184	static void thin_get(struct thin_c *tc);
				2185	static void thin_put(struct thin_c *tc);
				2186
				2187	/*
				2188	* We can't hold rcu_read_lock() around code that can block. So we
				2189	* find a thin with the rcu lock held; bump a refcount; then drop
				2190	* the lock.
				2191	*/
				2192	static struct thin_c get_first_thin(struct pool pool)
				2193	{
				2194	struct thin_c *tc = NULL;
				2195
				2196	rcu_read_lock();
				2197	if (!list_empty(&pool->active_thins)) {
				2198	tc = list_entry_rcu(pool->active_thins.next, struct thin_c, list);
				2199	thin_get(tc);
				2200	}
				2201	rcu_read_unlock();
				2202
				2203	return tc;
				2204	}
				2205
				2206	static struct thin_c get_next_thin(struct pool pool, struct thin_c *tc)
				2207	{
				2208	struct thin_c *old_tc = tc;
				2209
				2210	rcu_read_lock();
				2211	list_for_each_entry_continue_rcu(tc, &pool->active_thins, list) {
				2212	thin_get(tc);
				2213	thin_put(old_tc);
				2214	rcu_read_unlock();
				2215	return tc;
				2216	}
				2217	thin_put(old_tc);
				2218	rcu_read_unlock();
				2219
				2220	return NULL;
				2221	}
				2222
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2223	static void process_deferred_bios(struct pool *pool)
				2224	{
				2225	unsigned long flags;
				2226	struct bio *bio;
				2227	struct bio_list bios;
				2228	struct thin_c *tc;
				2229
Joe Thornber	b10ebd3	2014-04-08 11:29:01 +0100	[diff] [blame]	2230	tc = get_first_thin(pool);
				2231	while (tc) {
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2232	process_thin_deferred_cells(tc);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2233	process_thin_deferred_bios(tc);
Joe Thornber	b10ebd3	2014-04-08 11:29:01 +0100	[diff] [blame]	2234	tc = get_next_thin(pool, tc);
				2235	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2236
				2237	/*
				2238	* If there are any deferred flush bios, we must commit
				2239	* the metadata before issuing them.
				2240	*/
				2241	bio_list_init(&bios);
				2242	spin_lock_irqsave(&pool->lock, flags);
				2243	bio_list_merge(&bios, &pool->deferred_flush_bios);
				2244	bio_list_init(&pool->deferred_flush_bios);
				2245	spin_unlock_irqrestore(&pool->lock, flags);
				2246
Mike Snitzer	4d1662a	2014-02-06 06:08:56 -0500	[diff] [blame]	2247	if (bio_list_empty(&bios) &&
				2248	!(dm_pool_changed_this_transaction(pool->pmd) && need_commit_due_to_time(pool)))
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2249	return;
				2250
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	2251	if (commit(pool)) {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2252	while ((bio = bio_list_pop(&bios)))
				2253	bio_io_error(bio);
				2254	return;
				2255	}
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	2256	pool->last_commit_jiffies = jiffies;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2257
				2258	while ((bio = bio_list_pop(&bios)))
				2259	generic_make_request(bio);
				2260	}
				2261
				2262	static void do_worker(struct work_struct *ws)
				2263	{
				2264	struct pool *pool = container_of(ws, struct pool, worker);
				2265
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2266	throttle_work_start(&pool->throttle);
Joe Thornber	8a01a6a	2014-10-06 15:28:30 +0100	[diff] [blame]	2267	dm_pool_issue_prefetches(pool->pmd);
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2268	throttle_work_update(&pool->throttle);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2269	process_prepared(pool, &pool->prepared_mappings, &pool->process_prepared_mapping);
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2270	throttle_work_update(&pool->throttle);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2271	process_prepared(pool, &pool->prepared_discards, &pool->process_prepared_discard);
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2272	throttle_work_update(&pool->throttle);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2273	process_deferred_bios(pool);
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2274	throttle_work_complete(&pool->throttle);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2275	}
				2276
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	2277	/*
				2278	* We want to commit periodically so that not too much
				2279	* unwritten data builds up.
				2280	*/
				2281	static void do_waker(struct work_struct *ws)
				2282	{
				2283	struct pool *pool = container_of(to_delayed_work(ws), struct pool, waker);
				2284	wake_worker(pool);
				2285	queue_delayed_work(pool->wq, &pool->waker, COMMIT_PERIOD);
				2286	}
				2287
Joe Thornber	85ad643b	2014-05-09 15:59:38 +0100	[diff] [blame]	2288	/*
				2289	* We're holding onto IO to allow userland time to react. After the
				2290	* timeout either the pool will have been resized (and thus back in
				2291	* PM_WRITE mode), or we degrade to PM_READ_ONLY and start erroring IO.
				2292	*/
				2293	static void do_no_space_timeout(struct work_struct *ws)
				2294	{
				2295	struct pool *pool = container_of(to_delayed_work(ws), struct pool,
				2296	no_space_timeout);
				2297
				2298	if (get_pool_mode(pool) == PM_OUT_OF_DATA_SPACE && !pool->pf.error_if_no_space)
				2299	set_pool_mode(pool, PM_READ_ONLY);
				2300	}
				2301
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2302	/----------------------------------------------------------------/
				2303
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2304	struct pool_work {
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2305	struct work_struct worker;
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2306	struct completion complete;
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2307	};
				2308
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2309	static struct pool_work to_pool_work(struct work_struct ws)
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2310	{
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2311	return container_of(ws, struct pool_work, worker);
				2312	}
				2313
				2314	static void pool_work_complete(struct pool_work *pw)
				2315	{
				2316	complete(&pw->complete);
				2317	}
				2318
				2319	static void pool_work_wait(struct pool_work pw, struct pool pool,
				2320	void (fn)(struct work_struct ))
				2321	{
				2322	INIT_WORK_ONSTACK(&pw->worker, fn);
				2323	init_completion(&pw->complete);
				2324	queue_work(pool->wq, &pw->worker);
				2325	wait_for_completion(&pw->complete);
				2326	}
				2327
				2328	/----------------------------------------------------------------/
				2329
				2330	struct noflush_work {
				2331	struct pool_work pw;
				2332	struct thin_c *tc;
				2333	};
				2334
				2335	static struct noflush_work to_noflush(struct work_struct ws)
				2336	{
				2337	return container_of(to_pool_work(ws), struct noflush_work, pw);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2338	}
				2339
				2340	static void do_noflush_start(struct work_struct *ws)
				2341	{
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2342	struct noflush_work *w = to_noflush(ws);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2343	w->tc->requeue_mode = true;
				2344	requeue_io(w->tc);
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2345	pool_work_complete(&w->pw);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2346	}
				2347
				2348	static void do_noflush_stop(struct work_struct *ws)
				2349	{
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2350	struct noflush_work *w = to_noflush(ws);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2351	w->tc->requeue_mode = false;
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2352	pool_work_complete(&w->pw);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2353	}
				2354
				2355	static void noflush_work(struct thin_c tc, void (fn)(struct work_struct *))
				2356	{
				2357	struct noflush_work w;
				2358
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2359	w.tc = tc;
Joe Thornber	e7a3e87	2014-05-13 16:14:14 -0400	[diff] [blame]	2360	pool_work_wait(&w.pw, tc->pool, fn);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2361	}
				2362
				2363	/----------------------------------------------------------------/
				2364
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2365	static enum pool_mode get_pool_mode(struct pool *pool)
				2366	{
				2367	return pool->pf.mode;
				2368	}
				2369
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2370	static void notify_of_pool_mode_change(struct pool pool, const char new_mode)
				2371	{
				2372	dm_table_event(pool->ti->table);
				2373	DMINFO("%s: switching pool to %s mode",
				2374	dm_device_name(pool->pool_md), new_mode);
				2375	}
				2376
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	2377	static bool passdown_enabled(struct pool_c *pt)
				2378	{
				2379	return pt->adjusted_pf.discard_passdown;
				2380	}
				2381
				2382	static void set_discard_callbacks(struct pool *pool)
				2383	{
				2384	struct pool_c *pt = pool->ti->private;
				2385
				2386	if (passdown_enabled(pt)) {
				2387	pool->process_discard_cell = process_discard_cell_passdown;
				2388	pool->process_prepared_discard = process_prepared_discard_passdown;
				2389	} else {
				2390	pool->process_discard_cell = process_discard_cell_no_passdown;
				2391	pool->process_prepared_discard = process_prepared_discard_no_passdown;
				2392	}
				2393	}
				2394
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2395	static void set_pool_mode(struct pool *pool, enum pool_mode new_mode)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2396	{
Mike Snitzer	cdc2b41	2014-02-14 18:10:55 -0500	[diff] [blame]	2397	struct pool_c *pt = pool->ti->private;
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	2398	bool needs_check = dm_pool_metadata_needs_check(pool->pmd);
				2399	enum pool_mode old_mode = get_pool_mode(pool);
Mike Snitzer	80c5789	2014-05-20 13:38:33 -0400	[diff] [blame]	2400	unsigned long no_space_timeout = ACCESS_ONCE(no_space_timeout_secs) * HZ;
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	2401
				2402	/*
				2403	* Never allow the pool to transition to PM_WRITE mode if user
				2404	* intervention is required to verify metadata and data consistency.
				2405	*/
				2406	if (new_mode == PM_WRITE && needs_check) {
				2407	DMERR("%s: unable to switch pool to write mode until repaired.",
				2408	dm_device_name(pool->pool_md));
				2409	if (old_mode != new_mode)
				2410	new_mode = old_mode;
				2411	else
				2412	new_mode = PM_READ_ONLY;
				2413	}
				2414	/*
				2415	* If we were in PM_FAIL mode, rollback of metadata failed. We're
				2416	* not going to recover without a thin_repair. So we never let the
				2417	* pool move out of the old mode.
				2418	*/
				2419	if (old_mode == PM_FAIL)
				2420	new_mode = old_mode;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2421
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2422	switch (new_mode) {
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2423	case PM_FAIL:
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2424	if (old_mode != new_mode)
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2425	notify_of_pool_mode_change(pool, "failure");
Joe Thornber	5383ef3	2013-12-04 16:30:01 -0500	[diff] [blame]	2426	dm_pool_metadata_read_only(pool->pmd);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2427	pool->process_bio = process_bio_fail;
				2428	pool->process_discard = process_bio_fail;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2429	pool->process_cell = process_cell_fail;
				2430	pool->process_discard_cell = process_cell_fail;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2431	pool->process_prepared_mapping = process_prepared_mapping_fail;
				2432	pool->process_prepared_discard = process_prepared_discard_fail;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2433
				2434	error_retry_list(pool);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2435	break;
				2436
				2437	case PM_READ_ONLY:
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2438	if (old_mode != new_mode)
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2439	notify_of_pool_mode_change(pool, "read-only");
				2440	dm_pool_metadata_read_only(pool->pmd);
				2441	pool->process_bio = process_bio_read_only;
				2442	pool->process_discard = process_bio_success;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2443	pool->process_cell = process_cell_read_only;
				2444	pool->process_discard_cell = process_cell_success;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2445	pool->process_prepared_mapping = process_prepared_mapping_fail;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	2446	pool->process_prepared_discard = process_prepared_discard_success;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2447
				2448	error_retry_list(pool);
				2449	break;
				2450
				2451	case PM_OUT_OF_DATA_SPACE:
				2452	/*
				2453	* Ideally we'd never hit this state; the low water mark
				2454	* would trigger userland to extend the pool before we
				2455	* completely run out of data space. However, many small
				2456	* IOs to unprovisioned space can consume data space at an
				2457	* alarming rate. Adjust your low water mark if you're
				2458	* frequently seeing this mode.
				2459	*/
				2460	if (old_mode != new_mode)
				2461	notify_of_pool_mode_change(pool, "out-of-data-space");
				2462	pool->process_bio = process_bio_read_only;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2463	pool->process_discard = process_discard_bio;
				2464	pool->process_cell = process_cell_read_only;
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2465	pool->process_prepared_mapping = process_prepared_mapping;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	2466	set_discard_callbacks(pool);
Joe Thornber	85ad643b	2014-05-09 15:59:38 +0100	[diff] [blame]	2467
Mike Snitzer	80c5789	2014-05-20 13:38:33 -0400	[diff] [blame]	2468	if (!pool->pf.error_if_no_space && no_space_timeout)
				2469	queue_delayed_work(pool->wq, &pool->no_space_timeout, no_space_timeout);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2470	break;
				2471
				2472	case PM_WRITE:
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2473	if (old_mode != new_mode)
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	2474	notify_of_pool_mode_change(pool, "write");
Joe Thornber	9b7aaa6	2013-12-04 16:58:19 -0500	[diff] [blame]	2475	dm_pool_metadata_read_write(pool->pmd);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2476	pool->process_bio = process_bio;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2477	pool->process_discard = process_discard_bio;
				2478	pool->process_cell = process_cell;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2479	pool->process_prepared_mapping = process_prepared_mapping;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	2480	set_discard_callbacks(pool);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2481	break;
				2482	}
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2483
				2484	pool->pf.mode = new_mode;
Mike Snitzer	cdc2b41	2014-02-14 18:10:55 -0500	[diff] [blame]	2485	/*
				2486	* The pool mode may have changed, sync it so bind_control_target()
				2487	* doesn't cause an unexpected mode transition on resume.
				2488	*/
				2489	pt->adjusted_pf.mode = new_mode;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2490	}
				2491
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	2492	static void abort_transaction(struct pool *pool)
				2493	{
				2494	const char *dev_name = dm_device_name(pool->pool_md);
				2495
				2496	DMERR_LIMIT("%s: aborting current metadata transaction", dev_name);
				2497	if (dm_pool_abort_metadata(pool->pmd)) {
				2498	DMERR("%s: failed to abort metadata transaction", dev_name);
				2499	set_pool_mode(pool, PM_FAIL);
				2500	}
				2501
				2502	if (dm_pool_metadata_set_needs_check(pool->pmd)) {
				2503	DMERR("%s: failed to set 'needs_check' flag in metadata", dev_name);
				2504	set_pool_mode(pool, PM_FAIL);
				2505	}
				2506	}
				2507
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	2508	static void metadata_operation_failed(struct pool pool, const char op, int r)
				2509	{
				2510	DMERR_LIMIT("%s: metadata operation '%s' failed: error = %d",
				2511	dm_device_name(pool->pool_md), op, r);
				2512
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	2513	abort_transaction(pool);
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	2514	set_pool_mode(pool, PM_READ_ONLY);
				2515	}
				2516
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2517	/----------------------------------------------------------------/
				2518
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2519	/*
				2520	* Mapping functions.
				2521	*/
				2522
				2523	/*
				2524	* Called only while mapping a thin bio to hand it over to the workqueue.
				2525	*/
				2526	static void thin_defer_bio(struct thin_c tc, struct bio bio)
				2527	{
				2528	unsigned long flags;
				2529	struct pool *pool = tc->pool;
				2530
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2531	spin_lock_irqsave(&tc->lock, flags);
				2532	bio_list_add(&tc->deferred_bio_list, bio);
				2533	spin_unlock_irqrestore(&tc->lock, flags);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2534
				2535	wake_worker(pool);
				2536	}
				2537
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2538	static void thin_defer_bio_with_throttle(struct thin_c tc, struct bio bio)
				2539	{
				2540	struct pool *pool = tc->pool;
				2541
				2542	throttle_lock(&pool->throttle);
				2543	thin_defer_bio(tc, bio);
				2544	throttle_unlock(&pool->throttle);
				2545	}
				2546
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2547	static void thin_defer_cell(struct thin_c tc, struct dm_bio_prison_cell cell)
				2548	{
				2549	unsigned long flags;
				2550	struct pool *pool = tc->pool;
				2551
				2552	throttle_lock(&pool->throttle);
				2553	spin_lock_irqsave(&tc->lock, flags);
				2554	list_add_tail(&cell->user_list, &tc->deferred_cells);
				2555	spin_unlock_irqrestore(&tc->lock, flags);
				2556	throttle_unlock(&pool->throttle);
				2557
				2558	wake_worker(pool);
				2559	}
				2560
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	2561	static void thin_hook_bio(struct thin_c tc, struct bio bio)
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	2562	{
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	2563	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	2564
				2565	h->tc = tc;
				2566	h->shared_read_entry = NULL;
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2567	h->all_io_entry = NULL;
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	2568	h->overwrite_mapping = NULL;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	2569	h->cell = NULL;
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	2570	}
				2571
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2572	/*
				2573	* Non-blocking function called from the thin target's map function.
				2574	*/
Mikulas Patocka	7de3ee5	2012-12-21 20:23:41 +0000	[diff] [blame]	2575	static int thin_bio_map(struct dm_target ti, struct bio bio)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2576	{
				2577	int r;
				2578	struct thin_c *tc = ti->private;
				2579	dm_block_t block = get_bio_block(tc, bio);
				2580	struct dm_thin_device *td = tc->td;
				2581	struct dm_thin_lookup_result result;
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2582	struct dm_bio_prison_cell virt_cell, data_cell;
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2583	struct dm_cell_key key;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2584
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	2585	thin_hook_bio(tc, bio);
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2586
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2587	if (tc->requeue_mode) {
Christoph Hellwig	4246a0b	2015-07-20 15:29:37 +0200	[diff] [blame^]	2588	bio->bi_error = DM_ENDIO_REQUEUE;
				2589	bio_endio(bio);
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	2590	return DM_MAPIO_SUBMITTED;
				2591	}
				2592
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2593	if (get_pool_mode(tc->pool) == PM_FAIL) {
				2594	bio_io_error(bio);
				2595	return DM_MAPIO_SUBMITTED;
				2596	}
				2597
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	2598	if (bio->bi_rw & (REQ_DISCARD \| REQ_FLUSH \| REQ_FUA)) {
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2599	thin_defer_bio_with_throttle(tc, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2600	return DM_MAPIO_SUBMITTED;
				2601	}
				2602
Joe Thornber	c822ed9	2014-10-10 09:41:09 +0100	[diff] [blame]	2603	/*
				2604	* We must hold the virtual cell before doing the lookup, otherwise
				2605	* there's a race with discard.
				2606	*/
				2607	build_virtual_key(tc->td, block, &key);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2608	if (bio_detain(tc->pool, &key, bio, &virt_cell))
Joe Thornber	c822ed9	2014-10-10 09:41:09 +0100	[diff] [blame]	2609	return DM_MAPIO_SUBMITTED;
				2610
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2611	r = dm_thin_find_block(td, block, 0, &result);
				2612
				2613	/*
				2614	* Note that we defer readahead too.
				2615	*/
				2616	switch (r) {
				2617	case 0:
				2618	if (unlikely(result.shared)) {
				2619	/*
				2620	* We have a race condition here between the
				2621	* result.shared value returned by the lookup and
				2622	* snapshot creation, which may cause new
				2623	* sharing.
				2624	*
				2625	* To avoid this always quiesce the origin before
				2626	* taking the snap. You want to do this anyway to
				2627	* ensure a consistent application view
				2628	* (i.e. lockfs).
				2629	*
				2630	* More distant ancestors are irrelevant. The
				2631	* shared flag will be set in their case.
				2632	*/
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2633	thin_defer_cell(tc, virt_cell);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2634	return DM_MAPIO_SUBMITTED;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2635	}
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2636
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2637	build_data_key(tc->td, result.block, &key);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2638	if (bio_detain(tc->pool, &key, bio, &data_cell)) {
				2639	cell_defer_no_holder(tc, virt_cell);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2640	return DM_MAPIO_SUBMITTED;
				2641	}
				2642
				2643	inc_all_io_entry(tc->pool, bio);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2644	cell_defer_no_holder(tc, data_cell);
				2645	cell_defer_no_holder(tc, virt_cell);
Joe Thornber	e808807	2012-12-21 20:23:31 +0000	[diff] [blame]	2646
				2647	remap(tc, bio, result.block);
				2648	return DM_MAPIO_REMAPPED;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2649
				2650	case -ENODATA:
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2651	case -EWOULDBLOCK:
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2652	thin_defer_cell(tc, virt_cell);
Joe Thornber	2aab385	2012-12-21 20:23:33 +0000	[diff] [blame]	2653	return DM_MAPIO_SUBMITTED;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2654
				2655	default:
				2656	/*
				2657	* Must always call bio_io_error on failure.
				2658	* dm_thin_find_block can fail with -EINVAL if the
				2659	* pool is switched to fail-io mode.
				2660	*/
				2661	bio_io_error(bio);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	2662	cell_defer_no_holder(tc, virt_cell);
Joe Thornber	2aab385	2012-12-21 20:23:33 +0000	[diff] [blame]	2663	return DM_MAPIO_SUBMITTED;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2664	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2665	}
				2666
				2667	static int pool_is_congested(struct dm_target_callbacks *cb, int bdi_bits)
				2668	{
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2669	struct pool_c *pt = container_of(cb, struct pool_c, callbacks);
Mike Snitzer	760fe67	2014-03-20 08:36:47 -0400	[diff] [blame]	2670	struct request_queue *q;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2671
Mike Snitzer	760fe67	2014-03-20 08:36:47 -0400	[diff] [blame]	2672	if (get_pool_mode(pt->pool) == PM_OUT_OF_DATA_SPACE)
				2673	return 1;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2674
Mike Snitzer	760fe67	2014-03-20 08:36:47 -0400	[diff] [blame]	2675	q = bdev_get_queue(pt->data_dev->bdev);
				2676	return bdi_congested(&q->backing_dev_info, bdi_bits);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2677	}
				2678
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2679	static void requeue_bios(struct pool *pool)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2680	{
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2681	unsigned long flags;
				2682	struct thin_c *tc;
				2683
				2684	rcu_read_lock();
				2685	list_for_each_entry_rcu(tc, &pool->active_thins, list) {
				2686	spin_lock_irqsave(&tc->lock, flags);
				2687	bio_list_merge(&tc->deferred_bio_list, &tc->retry_on_resume_list);
				2688	bio_list_init(&tc->retry_on_resume_list);
				2689	spin_unlock_irqrestore(&tc->lock, flags);
				2690	}
				2691	rcu_read_unlock();
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2692	}
				2693
				2694	/*----------------------------------------------------------------
				2695	* Binding of control targets to a pool object
				2696	--------------------------------------------------------------/
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2697	static bool data_dev_supports_discard(struct pool_c *pt)
				2698	{
				2699	struct request_queue *q = bdev_get_queue(pt->data_dev->bdev);
				2700
				2701	return q && blk_queue_discard(q);
				2702	}
				2703
Joe Thornber	58051b9	2013-03-20 17:21:25 +0000	[diff] [blame]	2704	static bool is_factor(sector_t block_size, uint32_t n)
				2705	{
				2706	return !sector_div(block_size, n);
				2707	}
				2708
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2709	/*
				2710	* If discard_passdown was enabled verify that the data device
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2711	* supports discards. Disable discard_passdown if not.
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2712	*/
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2713	static void disable_passdown_if_not_supported(struct pool_c *pt)
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2714	{
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2715	struct pool *pool = pt->pool;
				2716	struct block_device *data_bdev = pt->data_dev->bdev;
				2717	struct queue_limits *data_limits = &bdev_get_queue(data_bdev)->limits;
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2718	const char *reason = NULL;
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2719	char buf[BDEVNAME_SIZE];
				2720
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2721	if (!pt->adjusted_pf.discard_passdown)
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2722	return;
				2723
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2724	if (!data_dev_supports_discard(pt))
				2725	reason = "discard unsupported";
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2726
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2727	else if (data_limits->max_discard_sectors < pool->sectors_per_block)
				2728	reason = "max discard sectors smaller than a block";
				2729
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2730	if (reason) {
				2731	DMWARN("Data device (%s) %s: Disabling discard passdown.", bdevname(data_bdev, buf), reason);
				2732	pt->adjusted_pf.discard_passdown = false;
				2733	}
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2734	}
				2735
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2736	static int bind_control_target(struct pool pool, struct dm_target ti)
				2737	{
				2738	struct pool_c *pt = ti->private;
				2739
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2740	/*
Joe Thornber	9b7aaa6	2013-12-04 16:58:19 -0500	[diff] [blame]	2741	* We want to make sure that a pool in PM_FAIL mode is never upgraded.
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2742	*/
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	2743	enum pool_mode old_mode = get_pool_mode(pool);
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	2744	enum pool_mode new_mode = pt->adjusted_pf.mode;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2745
Joe Thornber	9b7aaa6	2013-12-04 16:58:19 -0500	[diff] [blame]	2746	/*
Mike Snitzer	8b64e88	2013-12-20 14:27:28 -0500	[diff] [blame]	2747	* Don't change the pool's mode until set_pool_mode() below.
				2748	* Otherwise the pool's process_* function pointers may
				2749	* not match the desired pool mode.
				2750	*/
				2751	pt->adjusted_pf.mode = old_mode;
				2752
				2753	pool->ti = ti;
				2754	pool->pf = pt->adjusted_pf;
				2755	pool->low_water_blocks = pt->low_water_blocks;
				2756
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2757	set_pool_mode(pool, new_mode);
Mike Snitzer	f402693	2012-05-19 01:01:01 +0100	[diff] [blame]	2758
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2759	return 0;
				2760	}
				2761
				2762	static void unbind_control_target(struct pool pool, struct dm_target ti)
				2763	{
				2764	if (pool->ti == ti)
				2765	pool->ti = NULL;
				2766	}
				2767
				2768	/*----------------------------------------------------------------
				2769	* Pool creation
				2770	--------------------------------------------------------------/
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	2771	/* Initialize pool features. */
				2772	static void pool_features_init(struct pool_features *pf)
				2773	{
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2774	pf->mode = PM_WRITE;
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	2775	pf->zero_new_blocks = true;
				2776	pf->discard_enabled = true;
				2777	pf->discard_passdown = true;
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	2778	pf->error_if_no_space = false;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	2779	}
				2780
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2781	static void __pool_destroy(struct pool *pool)
				2782	{
				2783	__pool_table_remove(pool);
				2784
				2785	if (dm_pool_metadata_close(pool->pmd) < 0)
				2786	DMWARN("%s: dm_pool_metadata_close() failed.", __func__);
				2787
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	2788	dm_bio_prison_destroy(pool->prison);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2789	dm_kcopyd_client_destroy(pool->copier);
				2790
				2791	if (pool->wq)
				2792	destroy_workqueue(pool->wq);
				2793
				2794	if (pool->next_mapping)
				2795	mempool_free(pool->next_mapping, pool->mapping_pool);
				2796	mempool_destroy(pool->mapping_pool);
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	2797	dm_deferred_set_destroy(pool->shared_read_ds);
				2798	dm_deferred_set_destroy(pool->all_io_ds);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2799	kfree(pool);
				2800	}
				2801
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	2802	static struct kmem_cache *_new_mapping_cache;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	2803
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2804	static struct pool pool_create(struct mapped_device pool_md,
				2805	struct block_device *metadata_dev,
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2806	unsigned long block_size,
				2807	int read_only, char **error)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2808	{
				2809	int r;
				2810	void *err_p;
				2811	struct pool *pool;
				2812	struct dm_pool_metadata *pmd;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2813	bool format_device = read_only ? false : true;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2814
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2815	pmd = dm_pool_metadata_open(metadata_dev, block_size, format_device);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2816	if (IS_ERR(pmd)) {
				2817	*error = "Error creating metadata object";
				2818	return (struct pool *)pmd;
				2819	}
				2820
				2821	pool = kmalloc(sizeof(*pool), GFP_KERNEL);
				2822	if (!pool) {
				2823	*error = "Error allocating memory for pool";
				2824	err_p = ERR_PTR(-ENOMEM);
				2825	goto bad_pool;
				2826	}
				2827
				2828	pool->pmd = pmd;
				2829	pool->sectors_per_block = block_size;
Mikulas Patocka	f9a8e0c	2012-07-27 15:08:03 +0100	[diff] [blame]	2830	if (block_size & (block_size - 1))
				2831	pool->sectors_per_block_shift = -1;
				2832	else
				2833	pool->sectors_per_block_shift = __ffs(block_size);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2834	pool->low_water_blocks = 0;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	2835	pool_features_init(&pool->pf);
Joe Thornber	a195db2	2014-10-06 16:30:06 -0400	[diff] [blame]	2836	pool->prison = dm_bio_prison_create();
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2837	if (!pool->prison) {
				2838	*error = "Error creating pool's bio prison";
				2839	err_p = ERR_PTR(-ENOMEM);
				2840	goto bad_prison;
				2841	}
				2842
Mikulas Patocka	df5d2e9	2013-03-01 22:45:49 +0000	[diff] [blame]	2843	pool->copier = dm_kcopyd_client_create(&dm_kcopyd_throttle);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2844	if (IS_ERR(pool->copier)) {
				2845	r = PTR_ERR(pool->copier);
				2846	*error = "Error creating pool's kcopyd client";
				2847	err_p = ERR_PTR(r);
				2848	goto bad_kcopyd_client;
				2849	}
				2850
				2851	/*
				2852	* Create singlethreaded workqueue that will service all devices
				2853	* that use this metadata.
				2854	*/
				2855	pool->wq = alloc_ordered_workqueue("dm-" DM_MSG_PREFIX, WQ_MEM_RECLAIM);
				2856	if (!pool->wq) {
				2857	*error = "Error creating pool's workqueue";
				2858	err_p = ERR_PTR(-ENOMEM);
				2859	goto bad_wq;
				2860	}
				2861
Joe Thornber	7d327fe	2014-10-06 15:45:59 +0100	[diff] [blame]	2862	throttle_init(&pool->throttle);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2863	INIT_WORK(&pool->worker, do_worker);
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	2864	INIT_DELAYED_WORK(&pool->waker, do_waker);
Joe Thornber	85ad643b	2014-05-09 15:59:38 +0100	[diff] [blame]	2865	INIT_DELAYED_WORK(&pool->no_space_timeout, do_no_space_timeout);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2866	spin_lock_init(&pool->lock);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2867	bio_list_init(&pool->deferred_flush_bios);
				2868	INIT_LIST_HEAD(&pool->prepared_mappings);
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	2869	INIT_LIST_HEAD(&pool->prepared_discards);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	2870	INIT_LIST_HEAD(&pool->active_thins);
Joe Thornber	88a6621	2013-12-04 20:16:12 -0500	[diff] [blame]	2871	pool->low_water_triggered = false;
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	2872	pool->suspended = true;
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	2873
				2874	pool->shared_read_ds = dm_deferred_set_create();
				2875	if (!pool->shared_read_ds) {
				2876	*error = "Error creating pool's shared read deferred set";
				2877	err_p = ERR_PTR(-ENOMEM);
				2878	goto bad_shared_read_ds;
				2879	}
				2880
				2881	pool->all_io_ds = dm_deferred_set_create();
				2882	if (!pool->all_io_ds) {
				2883	*error = "Error creating pool's all io deferred set";
				2884	err_p = ERR_PTR(-ENOMEM);
				2885	goto bad_all_io_ds;
				2886	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2887
				2888	pool->next_mapping = NULL;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	2889	pool->mapping_pool = mempool_create_slab_pool(MAPPING_POOL_SIZE,
				2890	_new_mapping_cache);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2891	if (!pool->mapping_pool) {
				2892	*error = "Error creating pool's mapping mempool";
				2893	err_p = ERR_PTR(-ENOMEM);
				2894	goto bad_mapping_pool;
				2895	}
				2896
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2897	pool->ref_count = 1;
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	2898	pool->last_commit_jiffies = jiffies;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2899	pool->pool_md = pool_md;
				2900	pool->md_dev = metadata_dev;
				2901	__pool_table_insert(pool);
				2902
				2903	return pool;
				2904
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2905	bad_mapping_pool:
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	2906	dm_deferred_set_destroy(pool->all_io_ds);
				2907	bad_all_io_ds:
				2908	dm_deferred_set_destroy(pool->shared_read_ds);
				2909	bad_shared_read_ds:
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2910	destroy_workqueue(pool->wq);
				2911	bad_wq:
				2912	dm_kcopyd_client_destroy(pool->copier);
				2913	bad_kcopyd_client:
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	2914	dm_bio_prison_destroy(pool->prison);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2915	bad_prison:
				2916	kfree(pool);
				2917	bad_pool:
				2918	if (dm_pool_metadata_close(pmd))
				2919	DMWARN("%s: dm_pool_metadata_close() failed.", __func__);
				2920
				2921	return err_p;
				2922	}
				2923
				2924	static void __pool_inc(struct pool *pool)
				2925	{
				2926	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				2927	pool->ref_count++;
				2928	}
				2929
				2930	static void __pool_dec(struct pool *pool)
				2931	{
				2932	BUG_ON(!mutex_is_locked(&dm_thin_pool_table.mutex));
				2933	BUG_ON(!pool->ref_count);
				2934	if (!--pool->ref_count)
				2935	__pool_destroy(pool);
				2936	}
				2937
				2938	static struct pool __pool_find(struct mapped_device pool_md,
				2939	struct block_device *metadata_dev,
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2940	unsigned long block_size, int read_only,
				2941	char *error, int created)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2942	{
				2943	struct pool *pool = __pool_table_lookup_metadata_dev(metadata_dev);
				2944
				2945	if (pool) {
Mike Snitzer	f09996c	2012-07-27 15:07:59 +0100	[diff] [blame]	2946	if (pool->pool_md != pool_md) {
				2947	*error = "metadata device already in use by a pool";
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2948	return ERR_PTR(-EBUSY);
Mike Snitzer	f09996c	2012-07-27 15:07:59 +0100	[diff] [blame]	2949	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2950	__pool_inc(pool);
				2951
				2952	} else {
				2953	pool = __pool_table_lookup(pool_md);
				2954	if (pool) {
Mike Snitzer	f09996c	2012-07-27 15:07:59 +0100	[diff] [blame]	2955	if (pool->md_dev != metadata_dev) {
				2956	*error = "different pool cannot replace a pool";
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2957	return ERR_PTR(-EINVAL);
Mike Snitzer	f09996c	2012-07-27 15:07:59 +0100	[diff] [blame]	2958	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2959	__pool_inc(pool);
				2960
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	2961	} else {
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	2962	pool = pool_create(pool_md, metadata_dev, block_size, read_only, error);
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	2963	*created = 1;
				2964	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2965	}
				2966
				2967	return pool;
				2968	}
				2969
				2970	/*----------------------------------------------------------------
				2971	* Pool target methods
				2972	--------------------------------------------------------------/
				2973	static void pool_dtr(struct dm_target *ti)
				2974	{
				2975	struct pool_c *pt = ti->private;
				2976
				2977	mutex_lock(&dm_thin_pool_table.mutex);
				2978
				2979	unbind_control_target(pt->pool, ti);
				2980	__pool_dec(pt->pool);
				2981	dm_put_device(ti, pt->metadata_dev);
				2982	dm_put_device(ti, pt->data_dev);
				2983	kfree(pt);
				2984
				2985	mutex_unlock(&dm_thin_pool_table.mutex);
				2986	}
				2987
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2988	static int parse_pool_features(struct dm_arg_set as, struct pool_features pf,
				2989	struct dm_target *ti)
				2990	{
				2991	int r;
				2992	unsigned argc;
				2993	const char *arg_name;
				2994
				2995	static struct dm_arg _args[] = {
Mike Snitzer	74aa45c	2014-01-15 19:07:58 -0500	[diff] [blame]	2996	{0, 4, "Invalid number of pool feature arguments"},
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	2997	};
				2998
				2999	/*
				3000	* No feature arguments supplied.
				3001	*/
				3002	if (!as->argc)
				3003	return 0;
				3004
				3005	r = dm_read_arg_group(_args, as, &argc, &ti->error);
				3006	if (r)
				3007	return -EINVAL;
				3008
				3009	while (argc && !r) {
				3010	arg_name = dm_shift_arg(as);
				3011	argc--;
				3012
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3013	if (!strcasecmp(arg_name, "skip_block_zeroing"))
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	3014	pf->zero_new_blocks = false;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3015
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3016	else if (!strcasecmp(arg_name, "ignore_discard"))
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	3017	pf->discard_enabled = false;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3018
				3019	else if (!strcasecmp(arg_name, "no_discard_passdown"))
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	3020	pf->discard_passdown = false;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3021
				3022	else if (!strcasecmp(arg_name, "read_only"))
				3023	pf->mode = PM_READ_ONLY;
				3024
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3025	else if (!strcasecmp(arg_name, "error_if_no_space"))
				3026	pf->error_if_no_space = true;
				3027
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3028	else {
				3029	ti->error = "Unrecognised pool feature requested";
				3030	r = -EINVAL;
				3031	break;
				3032	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3033	}
				3034
				3035	return r;
				3036	}
				3037
Joe Thornber	ac8c3f3	2013-05-10 14:37:21 +0100	[diff] [blame]	3038	static void metadata_low_callback(void *context)
				3039	{
				3040	struct pool *pool = context;
				3041
				3042	DMWARN("%s: reached low water mark for metadata device: sending event.",
				3043	dm_device_name(pool->pool_md));
				3044
				3045	dm_table_event(pool->ti->table);
				3046	}
				3047
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3048	static sector_t get_dev_size(struct block_device *bdev)
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3049	{
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3050	return i_size_read(bdev->bd_inode) >> SECTOR_SHIFT;
				3051	}
				3052
				3053	static void warn_if_metadata_device_too_big(struct block_device *bdev)
				3054	{
				3055	sector_t metadata_dev_size = get_dev_size(bdev);
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3056	char buffer[BDEVNAME_SIZE];
				3057
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3058	if (metadata_dev_size > THIN_METADATA_MAX_SECTORS_WARNING)
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3059	DMWARN("Metadata device %s is larger than %u sectors: excess space will not be used.",
				3060	bdevname(bdev, buffer), THIN_METADATA_MAX_SECTORS);
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3061	}
				3062
				3063	static sector_t get_metadata_dev_size(struct block_device *bdev)
				3064	{
				3065	sector_t metadata_dev_size = get_dev_size(bdev);
				3066
				3067	if (metadata_dev_size > THIN_METADATA_MAX_SECTORS)
				3068	metadata_dev_size = THIN_METADATA_MAX_SECTORS;
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3069
				3070	return metadata_dev_size;
				3071	}
				3072
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3073	static dm_block_t get_metadata_dev_size_in_blocks(struct block_device *bdev)
				3074	{
				3075	sector_t metadata_dev_size = get_metadata_dev_size(bdev);
				3076
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3077	sector_div(metadata_dev_size, THIN_METADATA_BLOCK_SIZE);
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3078
				3079	return metadata_dev_size;
				3080	}
				3081
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3082	/*
Joe Thornber	ac8c3f3	2013-05-10 14:37:21 +0100	[diff] [blame]	3083	* When a metadata threshold is crossed a dm event is triggered, and
				3084	* userland should respond by growing the metadata device. We could let
				3085	* userland set the threshold, like we do with the data threshold, but I'm
				3086	* not sure they know enough to do this well.
				3087	*/
				3088	static dm_block_t calc_metadata_threshold(struct pool_c *pt)
				3089	{
				3090	/*
				3091	* 4M is ample for all ops with the possible exception of thin
				3092	* device deletion which is harmless if it fails (just retry the
				3093	* delete after you've grown the device).
				3094	*/
				3095	dm_block_t quarter = get_metadata_dev_size_in_blocks(pt->metadata_dev->bdev) / 4;
				3096	return min((dm_block_t)1024ULL /* 4M */, quarter);
				3097	}
				3098
				3099	/*
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3100	* thin-pool <metadata dev> <data dev>
				3101	* <data block size (sectors)>
				3102	* <low water mark (blocks)>
				3103	* [<#feature args> [<arg>]*]
				3104	*
				3105	* Optional feature arguments are:
				3106	* skip_block_zeroing: skips the zeroing of newly-provisioned blocks.
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3107	* ignore_discard: disable discard
				3108	* no_discard_passdown: don't pass discards down to the data device
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3109	* read_only: Don't allow any changes to be made to the pool metadata.
				3110	* error_if_no_space: error IOs, instead of queueing, if no space.
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3111	*/
				3112	static int pool_ctr(struct dm_target ti, unsigned argc, char *argv)
				3113	{
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3114	int r, pool_created = 0;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3115	struct pool_c *pt;
				3116	struct pool *pool;
				3117	struct pool_features pf;
				3118	struct dm_arg_set as;
				3119	struct dm_dev *data_dev;
				3120	unsigned long block_size;
				3121	dm_block_t low_water_blocks;
				3122	struct dm_dev *metadata_dev;
Joe Thornber	5d0db96	2013-05-10 14:37:19 +0100	[diff] [blame]	3123	fmode_t metadata_mode;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3124
				3125	/*
				3126	* FIXME Remove validation from scope of lock.
				3127	*/
				3128	mutex_lock(&dm_thin_pool_table.mutex);
				3129
				3130	if (argc < 4) {
				3131	ti->error = "Invalid argument count";
				3132	r = -EINVAL;
				3133	goto out_unlock;
				3134	}
Joe Thornber	5d0db96	2013-05-10 14:37:19 +0100	[diff] [blame]	3135
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3136	as.argc = argc;
				3137	as.argv = argv;
				3138
Joe Thornber	5d0db96	2013-05-10 14:37:19 +0100	[diff] [blame]	3139	/*
				3140	* Set default pool features.
				3141	*/
				3142	pool_features_init(&pf);
				3143
				3144	dm_consume_args(&as, 4);
				3145	r = parse_pool_features(&as, &pf, ti);
				3146	if (r)
				3147	goto out_unlock;
				3148
				3149	metadata_mode = FMODE_READ \| ((pf.mode == PM_READ_ONLY) ? 0 : FMODE_WRITE);
				3150	r = dm_get_device(ti, argv[0], metadata_mode, &metadata_dev);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3151	if (r) {
				3152	ti->error = "Error opening metadata block device";
				3153	goto out_unlock;
				3154	}
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3155	warn_if_metadata_device_too_big(metadata_dev->bdev);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3156
				3157	r = dm_get_device(ti, argv[1], FMODE_READ \| FMODE_WRITE, &data_dev);
				3158	if (r) {
				3159	ti->error = "Error getting data device";
				3160	goto out_metadata;
				3161	}
				3162
				3163	if (kstrtoul(argv[2], 10, &block_size) \|\| !block_size \|\|
				3164	block_size < DATA_DEV_BLOCK_SIZE_MIN_SECTORS \|\|
				3165	block_size > DATA_DEV_BLOCK_SIZE_MAX_SECTORS \|\|
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	3166	block_size & (DATA_DEV_BLOCK_SIZE_MIN_SECTORS - 1)) {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3167	ti->error = "Invalid block size";
				3168	r = -EINVAL;
				3169	goto out;
				3170	}
				3171
				3172	if (kstrtoull(argv[3], 10, (unsigned long long *)&low_water_blocks)) {
				3173	ti->error = "Invalid low water mark";
				3174	r = -EINVAL;
				3175	goto out;
				3176	}
				3177
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3178	pt = kzalloc(sizeof(*pt), GFP_KERNEL);
				3179	if (!pt) {
				3180	r = -ENOMEM;
				3181	goto out;
				3182	}
				3183
				3184	pool = __pool_find(dm_table_get_md(ti->table), metadata_dev->bdev,
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3185	block_size, pf.mode == PM_READ_ONLY, &ti->error, &pool_created);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3186	if (IS_ERR(pool)) {
				3187	r = PTR_ERR(pool);
				3188	goto out_free_pt;
				3189	}
				3190
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3191	/*
				3192	* 'pool_created' reflects whether this is the first table load.
				3193	* Top level discard support is not allowed to be changed after
				3194	* initial load. This would require a pool reload to trigger thin
				3195	* device changes.
				3196	*/
				3197	if (!pool_created && pf.discard_enabled != pool->pf.discard_enabled) {
				3198	ti->error = "Discard support cannot be disabled once enabled";
				3199	r = -EINVAL;
				3200	goto out_flags_changed;
				3201	}
				3202
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3203	pt->pool = pool;
				3204	pt->ti = ti;
				3205	pt->metadata_dev = metadata_dev;
				3206	pt->data_dev = data_dev;
				3207	pt->low_water_blocks = low_water_blocks;
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	3208	pt->adjusted_pf = pt->requested_pf = pf;
Alasdair G Kergon	55a62ee	2013-03-01 22:45:47 +0000	[diff] [blame]	3209	ti->num_flush_bios = 1;
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	3210
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3211	/*
				3212	* Only need to enable discards if the pool should pass
				3213	* them down to the data device. The thin device's discard
				3214	* processing will cause mappings to be removed from the btree.
				3215	*/
Mike Snitzer	b60ab99	2013-09-19 18:49:11 -0400	[diff] [blame]	3216	ti->discard_zeroes_data_unsupported = true;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3217	if (pf.discard_enabled && pf.discard_passdown) {
Alasdair G Kergon	55a62ee	2013-03-01 22:45:47 +0000	[diff] [blame]	3218	ti->num_discard_bios = 1;
Mike Snitzer	9bc142d	2012-09-26 23:45:46 +0100	[diff] [blame]	3219
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3220	/*
				3221	* Setting 'discards_supported' circumvents the normal
				3222	* stacking of discard limits (this keeps the pool and
				3223	* thin devices' discard limits consistent).
				3224	*/
Alasdair G Kergon	0ac5548	2012-07-27 15:08:08 +0100	[diff] [blame]	3225	ti->discards_supported = true;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3226	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3227	ti->private = pt;
				3228
Joe Thornber	ac8c3f3	2013-05-10 14:37:21 +0100	[diff] [blame]	3229	r = dm_pool_register_metadata_threshold(pt->pool->pmd,
				3230	calc_metadata_threshold(pt),
				3231	metadata_low_callback,
				3232	pool);
				3233	if (r)
				3234	goto out_free_pt;
				3235
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3236	pt->callbacks.congested_fn = pool_is_congested;
				3237	dm_table_add_target_callbacks(ti->table, &pt->callbacks);
				3238
				3239	mutex_unlock(&dm_thin_pool_table.mutex);
				3240
				3241	return 0;
				3242
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3243	out_flags_changed:
				3244	__pool_dec(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3245	out_free_pt:
				3246	kfree(pt);
				3247	out:
				3248	dm_put_device(ti, data_dev);
				3249	out_metadata:
				3250	dm_put_device(ti, metadata_dev);
				3251	out_unlock:
				3252	mutex_unlock(&dm_thin_pool_table.mutex);
				3253
				3254	return r;
				3255	}
				3256
Mikulas Patocka	7de3ee5	2012-12-21 20:23:41 +0000	[diff] [blame]	3257	static int pool_map(struct dm_target ti, struct bio bio)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3258	{
				3259	int r;
				3260	struct pool_c *pt = ti->private;
				3261	struct pool *pool = pt->pool;
				3262	unsigned long flags;
				3263
				3264	/*
				3265	* As this is a singleton target, ti->begin is always zero.
				3266	*/
				3267	spin_lock_irqsave(&pool->lock, flags);
				3268	bio->bi_bdev = pt->data_dev->bdev;
				3269	r = DM_MAPIO_REMAPPED;
				3270	spin_unlock_irqrestore(&pool->lock, flags);
				3271
				3272	return r;
				3273	}
				3274
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3275	static int maybe_resize_data_dev(struct dm_target ti, bool need_commit)
				3276	{
				3277	int r;
				3278	struct pool_c *pt = ti->private;
				3279	struct pool *pool = pt->pool;
				3280	sector_t data_size = ti->len;
				3281	dm_block_t sb_data_size;
				3282
				3283	*need_commit = false;
				3284
				3285	(void) sector_div(data_size, pool->sectors_per_block);
				3286
				3287	r = dm_pool_get_data_dev_size(pool->pmd, &sb_data_size);
				3288	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3289	DMERR("%s: failed to retrieve data device size",
				3290	dm_device_name(pool->pool_md));
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3291	return r;
				3292	}
				3293
				3294	if (data_size < sb_data_size) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3295	DMERR("%s: pool target (%llu blocks) too small: expected %llu",
				3296	dm_device_name(pool->pool_md),
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3297	(unsigned long long)data_size, sb_data_size);
				3298	return -EINVAL;
				3299
				3300	} else if (data_size > sb_data_size) {
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	3301	if (dm_pool_metadata_needs_check(pool->pmd)) {
				3302	DMERR("%s: unable to grow the data device until repaired.",
				3303	dm_device_name(pool->pool_md));
				3304	return 0;
				3305	}
				3306
Mike Snitzer	6f7f51d	2013-12-04 10:25:53 -0500	[diff] [blame]	3307	if (sb_data_size)
				3308	DMINFO("%s: growing the data device from %llu to %llu blocks",
				3309	dm_device_name(pool->pool_md),
				3310	sb_data_size, (unsigned long long)data_size);
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3311	r = dm_pool_resize_data_dev(pool->pmd, data_size);
				3312	if (r) {
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	3313	metadata_operation_failed(pool, "dm_pool_resize_data_dev", r);
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3314	return r;
				3315	}
				3316
				3317	*need_commit = true;
				3318	}
				3319
				3320	return 0;
				3321	}
				3322
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3323	static int maybe_resize_metadata_dev(struct dm_target ti, bool need_commit)
				3324	{
				3325	int r;
				3326	struct pool_c *pt = ti->private;
				3327	struct pool *pool = pt->pool;
				3328	dm_block_t metadata_dev_size, sb_metadata_dev_size;
				3329
				3330	*need_commit = false;
				3331
Alasdair G Kergon	610bba8	2013-05-19 18:57:50 +0100	[diff] [blame]	3332	metadata_dev_size = get_metadata_dev_size_in_blocks(pool->md_dev);
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3333
				3334	r = dm_pool_get_metadata_dev_size(pool->pmd, &sb_metadata_dev_size);
				3335	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3336	DMERR("%s: failed to retrieve metadata device size",
				3337	dm_device_name(pool->pool_md));
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3338	return r;
				3339	}
				3340
				3341	if (metadata_dev_size < sb_metadata_dev_size) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3342	DMERR("%s: metadata device (%llu blocks) too small: expected %llu",
				3343	dm_device_name(pool->pool_md),
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3344	metadata_dev_size, sb_metadata_dev_size);
				3345	return -EINVAL;
				3346
				3347	} else if (metadata_dev_size > sb_metadata_dev_size) {
Mike Snitzer	07f2b6e	2014-02-14 11:58:41 -0500	[diff] [blame]	3348	if (dm_pool_metadata_needs_check(pool->pmd)) {
				3349	DMERR("%s: unable to grow the metadata device until repaired.",
				3350	dm_device_name(pool->pool_md));
				3351	return 0;
				3352	}
				3353
Mike Snitzer	7d48935	2014-02-12 23:58:15 -0500	[diff] [blame]	3354	warn_if_metadata_device_too_big(pool->md_dev);
Mike Snitzer	6f7f51d	2013-12-04 10:25:53 -0500	[diff] [blame]	3355	DMINFO("%s: growing the metadata device from %llu to %llu blocks",
				3356	dm_device_name(pool->pool_md),
				3357	sb_metadata_dev_size, metadata_dev_size);
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3358	r = dm_pool_resize_metadata_dev(pool->pmd, metadata_dev_size);
				3359	if (r) {
Joe Thornber	b533065	2013-12-04 19:51:33 -0500	[diff] [blame]	3360	metadata_operation_failed(pool, "dm_pool_resize_metadata_dev", r);
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3361	return r;
				3362	}
				3363
				3364	*need_commit = true;
				3365	}
				3366
				3367	return 0;
				3368	}
				3369
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3370	/*
				3371	* Retrieves the number of blocks of the data device from
				3372	* the superblock and compares it to the actual device size,
				3373	* thus resizing the data device in case it has grown.
				3374	*
				3375	* This both copes with opening preallocated data devices in the ctr
				3376	* being followed by a resume
				3377	* -and-
				3378	* calling the resume method individually after userspace has
				3379	* grown the data device in reaction to a table event.
				3380	*/
				3381	static int pool_preresume(struct dm_target *ti)
				3382	{
				3383	int r;
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3384	bool need_commit1, need_commit2;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3385	struct pool_c *pt = ti->private;
				3386	struct pool *pool = pt->pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3387
				3388	/*
				3389	* Take control of the pool object.
				3390	*/
				3391	r = bind_control_target(pool, ti);
				3392	if (r)
				3393	return r;
				3394
Joe Thornber	b17446d	2013-05-10 14:37:18 +0100	[diff] [blame]	3395	r = maybe_resize_data_dev(ti, &need_commit1);
				3396	if (r)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3397	return r;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3398
Joe Thornber	24347e9	2013-05-10 14:37:19 +0100	[diff] [blame]	3399	r = maybe_resize_metadata_dev(ti, &need_commit2);
				3400	if (r)
				3401	return r;
				3402
				3403	if (need_commit1 \|\| need_commit2)
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	3404	(void) commit(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3405
				3406	return 0;
				3407	}
				3408
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	3409	static void pool_suspend_active_thins(struct pool *pool)
				3410	{
				3411	struct thin_c *tc;
				3412
				3413	/* Suspend all active thin devices */
				3414	tc = get_first_thin(pool);
				3415	while (tc) {
				3416	dm_internal_suspend_noflush(tc->thin_md);
				3417	tc = get_next_thin(pool, tc);
				3418	}
				3419	}
				3420
				3421	static void pool_resume_active_thins(struct pool *pool)
				3422	{
				3423	struct thin_c *tc;
				3424
				3425	/* Resume all active thin devices */
				3426	tc = get_first_thin(pool);
				3427	while (tc) {
				3428	dm_internal_resume(tc->thin_md);
				3429	tc = get_next_thin(pool, tc);
				3430	}
				3431	}
				3432
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3433	static void pool_resume(struct dm_target *ti)
				3434	{
				3435	struct pool_c *pt = ti->private;
				3436	struct pool *pool = pt->pool;
				3437	unsigned long flags;
				3438
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	3439	/*
				3440	* Must requeue active_thins' bios and then resume
				3441	* active_thins _before_ clearing 'suspend' flag.
				3442	*/
				3443	requeue_bios(pool);
				3444	pool_resume_active_thins(pool);
				3445
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3446	spin_lock_irqsave(&pool->lock, flags);
Joe Thornber	88a6621	2013-12-04 20:16:12 -0500	[diff] [blame]	3447	pool->low_water_triggered = false;
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3448	pool->suspended = false;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3449	spin_unlock_irqrestore(&pool->lock, flags);
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3450
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	3451	do_waker(&pool->waker.work);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3452	}
				3453
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3454	static void pool_presuspend(struct dm_target *ti)
				3455	{
				3456	struct pool_c *pt = ti->private;
				3457	struct pool *pool = pt->pool;
				3458	unsigned long flags;
				3459
				3460	spin_lock_irqsave(&pool->lock, flags);
				3461	pool->suspended = true;
				3462	spin_unlock_irqrestore(&pool->lock, flags);
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	3463
				3464	pool_suspend_active_thins(pool);
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3465	}
				3466
				3467	static void pool_presuspend_undo(struct dm_target *ti)
				3468	{
				3469	struct pool_c *pt = ti->private;
				3470	struct pool *pool = pt->pool;
				3471	unsigned long flags;
				3472
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	3473	pool_resume_active_thins(pool);
				3474
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3475	spin_lock_irqsave(&pool->lock, flags);
				3476	pool->suspended = false;
				3477	spin_unlock_irqrestore(&pool->lock, flags);
				3478	}
				3479
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3480	static void pool_postsuspend(struct dm_target *ti)
				3481	{
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3482	struct pool_c *pt = ti->private;
				3483	struct pool *pool = pt->pool;
				3484
Joe Thornber	905e51b	2012-03-28 18:41:27 +0100	[diff] [blame]	3485	cancel_delayed_work(&pool->waker);
Joe Thornber	85ad643b	2014-05-09 15:59:38 +0100	[diff] [blame]	3486	cancel_delayed_work(&pool->no_space_timeout);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3487	flush_workqueue(pool->wq);
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	3488	(void) commit(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3489	}
				3490
				3491	static int check_arg_count(unsigned argc, unsigned args_required)
				3492	{
				3493	if (argc != args_required) {
				3494	DMWARN("Message received with %u arguments instead of %u.",
				3495	argc, args_required);
				3496	return -EINVAL;
				3497	}
				3498
				3499	return 0;
				3500	}
				3501
				3502	static int read_dev_id(char arg, dm_thin_id dev_id, int warning)
				3503	{
				3504	if (!kstrtoull(arg, 10, (unsigned long long *)dev_id) &&
				3505	*dev_id <= MAX_DEV_ID)
				3506	return 0;
				3507
				3508	if (warning)
				3509	DMWARN("Message received with invalid device id: %s", arg);
				3510
				3511	return -EINVAL;
				3512	}
				3513
				3514	static int process_create_thin_mesg(unsigned argc, char *argv, struct pool pool)
				3515	{
				3516	dm_thin_id dev_id;
				3517	int r;
				3518
				3519	r = check_arg_count(argc, 2);
				3520	if (r)
				3521	return r;
				3522
				3523	r = read_dev_id(argv[1], &dev_id, 1);
				3524	if (r)
				3525	return r;
				3526
				3527	r = dm_pool_create_thin(pool->pmd, dev_id);
				3528	if (r) {
				3529	DMWARN("Creation of new thinly-provisioned device with id %s failed.",
				3530	argv[1]);
				3531	return r;
				3532	}
				3533
				3534	return 0;
				3535	}
				3536
				3537	static int process_create_snap_mesg(unsigned argc, char *argv, struct pool pool)
				3538	{
				3539	dm_thin_id dev_id;
				3540	dm_thin_id origin_dev_id;
				3541	int r;
				3542
				3543	r = check_arg_count(argc, 3);
				3544	if (r)
				3545	return r;
				3546
				3547	r = read_dev_id(argv[1], &dev_id, 1);
				3548	if (r)
				3549	return r;
				3550
				3551	r = read_dev_id(argv[2], &origin_dev_id, 1);
				3552	if (r)
				3553	return r;
				3554
				3555	r = dm_pool_create_snap(pool->pmd, dev_id, origin_dev_id);
				3556	if (r) {
				3557	DMWARN("Creation of new snapshot %s of device %s failed.",
				3558	argv[1], argv[2]);
				3559	return r;
				3560	}
				3561
				3562	return 0;
				3563	}
				3564
				3565	static int process_delete_mesg(unsigned argc, char *argv, struct pool pool)
				3566	{
				3567	dm_thin_id dev_id;
				3568	int r;
				3569
				3570	r = check_arg_count(argc, 2);
				3571	if (r)
				3572	return r;
				3573
				3574	r = read_dev_id(argv[1], &dev_id, 1);
				3575	if (r)
				3576	return r;
				3577
				3578	r = dm_pool_delete_thin_device(pool->pmd, dev_id);
				3579	if (r)
				3580	DMWARN("Deletion of thin device %s failed.", argv[1]);
				3581
				3582	return r;
				3583	}
				3584
				3585	static int process_set_transaction_id_mesg(unsigned argc, char *argv, struct pool pool)
				3586	{
				3587	dm_thin_id old_id, new_id;
				3588	int r;
				3589
				3590	r = check_arg_count(argc, 3);
				3591	if (r)
				3592	return r;
				3593
				3594	if (kstrtoull(argv[1], 10, (unsigned long long *)&old_id)) {
				3595	DMWARN("set_transaction_id message: Unrecognised id %s.", argv[1]);
				3596	return -EINVAL;
				3597	}
				3598
				3599	if (kstrtoull(argv[2], 10, (unsigned long long *)&new_id)) {
				3600	DMWARN("set_transaction_id message: Unrecognised new id %s.", argv[2]);
				3601	return -EINVAL;
				3602	}
				3603
				3604	r = dm_pool_set_metadata_transaction_id(pool->pmd, old_id, new_id);
				3605	if (r) {
				3606	DMWARN("Failed to change transaction id from %s to %s.",
				3607	argv[1], argv[2]);
				3608	return r;
				3609	}
				3610
				3611	return 0;
				3612	}
				3613
Joe Thornber	cc8394d	2012-06-03 00:30:01 +0100	[diff] [blame]	3614	static int process_reserve_metadata_snap_mesg(unsigned argc, char *argv, struct pool pool)
				3615	{
				3616	int r;
				3617
				3618	r = check_arg_count(argc, 1);
				3619	if (r)
				3620	return r;
				3621
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	3622	(void) commit(pool);
Joe Thornber	0d200ae	2012-07-03 12:55:31 +0100	[diff] [blame]	3623
Joe Thornber	cc8394d	2012-06-03 00:30:01 +0100	[diff] [blame]	3624	r = dm_pool_reserve_metadata_snap(pool->pmd);
				3625	if (r)
				3626	DMWARN("reserve_metadata_snap message failed.");
				3627
				3628	return r;
				3629	}
				3630
				3631	static int process_release_metadata_snap_mesg(unsigned argc, char *argv, struct pool pool)
				3632	{
				3633	int r;
				3634
				3635	r = check_arg_count(argc, 1);
				3636	if (r)
				3637	return r;
				3638
				3639	r = dm_pool_release_metadata_snap(pool->pmd);
				3640	if (r)
				3641	DMWARN("release_metadata_snap message failed.");
				3642
				3643	return r;
				3644	}
				3645
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3646	/*
				3647	* Messages supported:
				3648	* create_thin <dev_id>
				3649	* create_snap <dev_id> <origin_id>
				3650	* delete <dev_id>
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3651	* set_transaction_id <current_trans_id> <new_trans_id>
Joe Thornber	cc8394d	2012-06-03 00:30:01 +0100	[diff] [blame]	3652	* reserve_metadata_snap
				3653	* release_metadata_snap
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3654	*/
				3655	static int pool_message(struct dm_target ti, unsigned argc, char *argv)
				3656	{
				3657	int r = -EINVAL;
				3658	struct pool_c *pt = ti->private;
				3659	struct pool *pool = pt->pool;
				3660
Joe Thornber	2a7eaea	2015-01-26 11:38:21 +0000	[diff] [blame]	3661	if (get_pool_mode(pool) >= PM_READ_ONLY) {
				3662	DMERR("%s: unable to service pool target messages in READ_ONLY or FAIL mode",
				3663	dm_device_name(pool->pool_md));
Mike Snitzer	fd46769	2015-06-09 12:31:26 -0400	[diff] [blame]	3664	return -EOPNOTSUPP;
Joe Thornber	2a7eaea	2015-01-26 11:38:21 +0000	[diff] [blame]	3665	}
				3666
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3667	if (!strcasecmp(argv[0], "create_thin"))
				3668	r = process_create_thin_mesg(argc, argv, pool);
				3669
				3670	else if (!strcasecmp(argv[0], "create_snap"))
				3671	r = process_create_snap_mesg(argc, argv, pool);
				3672
				3673	else if (!strcasecmp(argv[0], "delete"))
				3674	r = process_delete_mesg(argc, argv, pool);
				3675
				3676	else if (!strcasecmp(argv[0], "set_transaction_id"))
				3677	r = process_set_transaction_id_mesg(argc, argv, pool);
				3678
Joe Thornber	cc8394d	2012-06-03 00:30:01 +0100	[diff] [blame]	3679	else if (!strcasecmp(argv[0], "reserve_metadata_snap"))
				3680	r = process_reserve_metadata_snap_mesg(argc, argv, pool);
				3681
				3682	else if (!strcasecmp(argv[0], "release_metadata_snap"))
				3683	r = process_release_metadata_snap_mesg(argc, argv, pool);
				3684
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3685	else
				3686	DMWARN("Unrecognised thin pool target message received: %s", argv[0]);
				3687
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3688	if (!r)
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	3689	(void) commit(pool);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3690
				3691	return r;
				3692	}
				3693
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3694	static void emit_flags(struct pool_features pf, char result,
				3695	unsigned sz, unsigned maxlen)
				3696	{
				3697	unsigned count = !pf->zero_new_blocks + !pf->discard_enabled +
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3698	!pf->discard_passdown + (pf->mode == PM_READ_ONLY) +
				3699	pf->error_if_no_space;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3700	DMEMIT("%u ", count);
				3701
				3702	if (!pf->zero_new_blocks)
				3703	DMEMIT("skip_block_zeroing ");
				3704
				3705	if (!pf->discard_enabled)
				3706	DMEMIT("ignore_discard ");
				3707
				3708	if (!pf->discard_passdown)
				3709	DMEMIT("no_discard_passdown ");
				3710
				3711	if (pf->mode == PM_READ_ONLY)
				3712	DMEMIT("read_only ");
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3713
				3714	if (pf->error_if_no_space)
				3715	DMEMIT("error_if_no_space ");
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3716	}
				3717
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3718	/*
				3719	* Status line is:
				3720	* <transaction id> <used metadata sectors>/<total metadata sectors>
				3721	* <used data sectors>/<total data sectors> <held metadata root>
				3722	*/
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3723	static void pool_status(struct dm_target *ti, status_type_t type,
				3724	unsigned status_flags, char *result, unsigned maxlen)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3725	{
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3726	int r;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3727	unsigned sz = 0;
				3728	uint64_t transaction_id;
				3729	dm_block_t nr_free_blocks_data;
				3730	dm_block_t nr_free_blocks_metadata;
				3731	dm_block_t nr_blocks_data;
				3732	dm_block_t nr_blocks_metadata;
				3733	dm_block_t held_root;
				3734	char buf[BDEVNAME_SIZE];
				3735	char buf2[BDEVNAME_SIZE];
				3736	struct pool_c *pt = ti->private;
				3737	struct pool *pool = pt->pool;
				3738
				3739	switch (type) {
				3740	case STATUSTYPE_INFO:
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3741	if (get_pool_mode(pool) == PM_FAIL) {
				3742	DMEMIT("Fail");
				3743	break;
				3744	}
				3745
Alasdair G Kergon	1f4e0ff	2012-07-27 15:08:16 +0100	[diff] [blame]	3746	/* Commit to ensure statistics aren't out-of-date */
				3747	if (!(status_flags & DM_STATUS_NOFLUSH_FLAG) && !dm_suspended(ti))
Joe Thornber	020cc3b	2013-12-04 15:05:36 -0500	[diff] [blame]	3748	(void) commit(pool);
Alasdair G Kergon	1f4e0ff	2012-07-27 15:08:16 +0100	[diff] [blame]	3749
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3750	r = dm_pool_get_metadata_transaction_id(pool->pmd, &transaction_id);
				3751	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3752	DMERR("%s: dm_pool_get_metadata_transaction_id returned %d",
				3753	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3754	goto err;
				3755	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3756
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3757	r = dm_pool_get_free_metadata_block_count(pool->pmd, &nr_free_blocks_metadata);
				3758	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3759	DMERR("%s: dm_pool_get_free_metadata_block_count returned %d",
				3760	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3761	goto err;
				3762	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3763
				3764	r = dm_pool_get_metadata_dev_size(pool->pmd, &nr_blocks_metadata);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3765	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3766	DMERR("%s: dm_pool_get_metadata_dev_size returned %d",
				3767	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3768	goto err;
				3769	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3770
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3771	r = dm_pool_get_free_block_count(pool->pmd, &nr_free_blocks_data);
				3772	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3773	DMERR("%s: dm_pool_get_free_block_count returned %d",
				3774	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3775	goto err;
				3776	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3777
				3778	r = dm_pool_get_data_dev_size(pool->pmd, &nr_blocks_data);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3779	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3780	DMERR("%s: dm_pool_get_data_dev_size returned %d",
				3781	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3782	goto err;
				3783	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3784
Joe Thornber	cc8394d	2012-06-03 00:30:01 +0100	[diff] [blame]	3785	r = dm_pool_get_metadata_snap(pool->pmd, &held_root);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3786	if (r) {
Mike Snitzer	4fa5971	2013-08-21 17:30:40 -0400	[diff] [blame]	3787	DMERR("%s: dm_pool_get_metadata_snap returned %d",
				3788	dm_device_name(pool->pool_md), r);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3789	goto err;
				3790	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3791
				3792	DMEMIT("%llu %llu/%llu %llu/%llu ",
				3793	(unsigned long long)transaction_id,
				3794	(unsigned long long)(nr_blocks_metadata - nr_free_blocks_metadata),
				3795	(unsigned long long)nr_blocks_metadata,
				3796	(unsigned long long)(nr_blocks_data - nr_free_blocks_data),
				3797	(unsigned long long)nr_blocks_data);
				3798
				3799	if (held_root)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3800	DMEMIT("%llu ", held_root);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3801	else
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3802	DMEMIT("- ");
				3803
Joe Thornber	3e1a069	2014-03-03 16:03:26 +0000	[diff] [blame]	3804	if (pool->pf.mode == PM_OUT_OF_DATA_SPACE)
				3805	DMEMIT("out_of_data_space ");
				3806	else if (pool->pf.mode == PM_READ_ONLY)
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3807	DMEMIT("ro ");
				3808	else
				3809	DMEMIT("rw ");
				3810
Mike Snitzer	018debe	2012-12-21 20:23:32 +0000	[diff] [blame]	3811	if (!pool->pf.discard_enabled)
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3812	DMEMIT("ignore_discard ");
Mike Snitzer	018debe	2012-12-21 20:23:32 +0000	[diff] [blame]	3813	else if (pool->pf.discard_passdown)
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3814	DMEMIT("discard_passdown ");
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	3815	else
Mike Snitzer	787a996c	2013-12-06 16:21:43 -0500	[diff] [blame]	3816	DMEMIT("no_discard_passdown ");
				3817
				3818	if (pool->pf.error_if_no_space)
				3819	DMEMIT("error_if_no_space ");
				3820	else
				3821	DMEMIT("queue_if_no_space ");
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3822
				3823	break;
				3824
				3825	case STATUSTYPE_TABLE:
				3826	DMEMIT("%s %s %lu %llu ",
				3827	format_dev_t(buf, pt->metadata_dev->bdev->bd_dev),
				3828	format_dev_t(buf2, pt->data_dev->bdev->bd_dev),
				3829	(unsigned long)pool->sectors_per_block,
				3830	(unsigned long long)pt->low_water_blocks);
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	3831	emit_flags(&pt->requested_pf, result, sz, maxlen);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3832	break;
				3833	}
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3834	return;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3835
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	3836	err:
				3837	DMEMIT("Error");
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3838	}
				3839
				3840	static int pool_iterate_devices(struct dm_target *ti,
				3841	iterate_devices_callout_fn fn, void *data)
				3842	{
				3843	struct pool_c *pt = ti->private;
				3844
				3845	return fn(ti, pt->data_dev, 0, ti->len, data);
				3846	}
				3847
				3848	static int pool_merge(struct dm_target ti, struct bvec_merge_data bvm,
				3849	struct bio_vec *biovec, int max_size)
				3850	{
				3851	struct pool_c *pt = ti->private;
				3852	struct request_queue *q = bdev_get_queue(pt->data_dev->bdev);
				3853
				3854	if (!q->merge_bvec_fn)
				3855	return max_size;
				3856
				3857	bvm->bi_bdev = pt->data_dev->bdev;
				3858
				3859	return min(max_size, q->merge_bvec_fn(q, bvm, biovec));
				3860	}
				3861
				3862	static void pool_io_hints(struct dm_target ti, struct queue_limits limits)
				3863	{
				3864	struct pool_c *pt = ti->private;
				3865	struct pool *pool = pt->pool;
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	3866	sector_t io_opt_sectors = limits->io_opt >> SECTOR_SHIFT;
				3867
				3868	/*
Mike Snitzer	d200c30	2014-11-20 18:07:43 -0500	[diff] [blame]	3869	* If max_sectors is smaller than pool->sectors_per_block adjust it
				3870	* to the highest possible power-of-2 factor of pool->sectors_per_block.
				3871	* This is especially beneficial when the pool's data device is a RAID
				3872	* device that has a full stripe width that matches pool->sectors_per_block
				3873	* -- because even though partial RAID stripe-sized IOs will be issued to a
				3874	* single RAID stripe; when aggregated they will end on a full RAID stripe
				3875	* boundary.. which avoids additional partial RAID stripe writes cascading
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	3876	*/
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	3877	if (limits->max_sectors < pool->sectors_per_block) {
				3878	while (!is_factor(pool->sectors_per_block, limits->max_sectors)) {
				3879	if ((limits->max_sectors & (limits->max_sectors - 1)) == 0)
				3880	limits->max_sectors--;
				3881	limits->max_sectors = rounddown_pow_of_two(limits->max_sectors);
				3882	}
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	3883	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3884
Mike Snitzer	0cc67cd	2013-08-20 15:02:41 -0400	[diff] [blame]	3885	/*
				3886	* If the system-determined stacked limits are compatible with the
				3887	* pool's blocksize (io_opt is a factor) do not override them.
				3888	*/
				3889	if (io_opt_sectors < pool->sectors_per_block \|\|
Mike Snitzer	604ea90	2014-10-09 18:43:25 -0400	[diff] [blame]	3890	!is_factor(io_opt_sectors, pool->sectors_per_block)) {
				3891	if (is_factor(pool->sectors_per_block, limits->max_sectors))
				3892	blk_limits_io_min(limits, limits->max_sectors << SECTOR_SHIFT);
				3893	else
				3894	blk_limits_io_min(limits, pool->sectors_per_block << SECTOR_SHIFT);
Mike Snitzer	0cc67cd	2013-08-20 15:02:41 -0400	[diff] [blame]	3895	blk_limits_io_opt(limits, pool->sectors_per_block << SECTOR_SHIFT);
				3896	}
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	3897
				3898	/*
				3899	* pt->adjusted_pf is a staging area for the actual features to use.
				3900	* They get transferred to the live pool in bind_control_target()
				3901	* called from pool_preresume().
				3902	*/
Mike Snitzer	b60ab99	2013-09-19 18:49:11 -0400	[diff] [blame]	3903	if (!pt->adjusted_pf.discard_enabled) {
				3904	/*
				3905	* Must explicitly disallow stacking discard limits otherwise the
				3906	* block layer will stack them if pool's data device has support.
				3907	* QUEUE_FLAG_DISCARD wouldn't be set but there is no way for the
				3908	* user to see that, so make sure to set all discard limits to 0.
				3909	*/
				3910	limits->discard_granularity = 0;
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	3911	return;
Mike Snitzer	b60ab99	2013-09-19 18:49:11 -0400	[diff] [blame]	3912	}
Mike Snitzer	0424caa	2012-09-26 23:45:47 +0100	[diff] [blame]	3913
				3914	disable_passdown_if_not_supported(pt);
				3915
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	3916	/*
				3917	* The pool uses the same discard limits as the underlying data
				3918	* device. DM core has already set this up.
				3919	*/
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3920	}
				3921
				3922	static struct target_type pool_target = {
				3923	.name = "thin-pool",
				3924	.features = DM_TARGET_SINGLETON \| DM_TARGET_ALWAYS_WRITEABLE \|
				3925	DM_TARGET_IMMUTABLE,
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	3926	.version = {1, 15, 0},
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3927	.module = THIS_MODULE,
				3928	.ctr = pool_ctr,
				3929	.dtr = pool_dtr,
				3930	.map = pool_map,
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	3931	.presuspend = pool_presuspend,
				3932	.presuspend_undo = pool_presuspend_undo,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3933	.postsuspend = pool_postsuspend,
				3934	.preresume = pool_preresume,
				3935	.resume = pool_resume,
				3936	.message = pool_message,
				3937	.status = pool_status,
				3938	.merge = pool_merge,
				3939	.iterate_devices = pool_iterate_devices,
				3940	.io_hints = pool_io_hints,
				3941	};
				3942
				3943	/*----------------------------------------------------------------
				3944	* Thin target methods
				3945	--------------------------------------------------------------/
Joe Thornber	b10ebd3	2014-04-08 11:29:01 +0100	[diff] [blame]	3946	static void thin_get(struct thin_c *tc)
				3947	{
				3948	atomic_inc(&tc->refcount);
				3949	}
				3950
				3951	static void thin_put(struct thin_c *tc)
				3952	{
				3953	if (atomic_dec_and_test(&tc->refcount))
				3954	complete(&tc->can_destroy);
				3955	}
				3956
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3957	static void thin_dtr(struct dm_target *ti)
				3958	{
				3959	struct thin_c *tc = ti->private;
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	3960	unsigned long flags;
				3961
				3962	spin_lock_irqsave(&tc->pool->lock, flags);
				3963	list_del_rcu(&tc->list);
				3964	spin_unlock_irqrestore(&tc->pool->lock, flags);
				3965	synchronize_rcu();
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3966
Mikulas Patocka	17181fb	2014-11-05 17:00:13 -0500	[diff] [blame]	3967	thin_put(tc);
				3968	wait_for_completion(&tc->can_destroy);
				3969
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3970	mutex_lock(&dm_thin_pool_table.mutex);
				3971
				3972	__pool_dec(tc->pool);
				3973	dm_pool_close_thin_device(tc->td);
				3974	dm_put_device(ti, tc->pool_dev);
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	3975	if (tc->origin_dev)
				3976	dm_put_device(ti, tc->origin_dev);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3977	kfree(tc);
				3978
				3979	mutex_unlock(&dm_thin_pool_table.mutex);
				3980	}
				3981
				3982	/*
				3983	* Thin target parameters:
				3984	*
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	3985	* <pool_dev> <dev_id> [origin_dev]
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3986	*
				3987	* pool_dev: the path to the pool (eg, /dev/mapper/my_pool)
				3988	* dev_id: the internal device identifier
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	3989	* origin_dev: a device external to the pool that should act as the origin
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	3990	*
				3991	* If the pool device has discards disabled, they get disabled for the thin
				3992	* device as well.
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3993	*/
				3994	static int thin_ctr(struct dm_target ti, unsigned argc, char *argv)
				3995	{
				3996	int r;
				3997	struct thin_c *tc;
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	3998	struct dm_dev pool_dev, origin_dev;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	3999	struct mapped_device *pool_md;
Joe Thornber	5e3283e	2014-04-08 11:08:41 +0100	[diff] [blame]	4000	unsigned long flags;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4001
				4002	mutex_lock(&dm_thin_pool_table.mutex);
				4003
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	4004	if (argc != 2 && argc != 3) {
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4005	ti->error = "Invalid argument count";
				4006	r = -EINVAL;
				4007	goto out_unlock;
				4008	}
				4009
				4010	tc = ti->private = kzalloc(sizeof(*tc), GFP_KERNEL);
				4011	if (!tc) {
				4012	ti->error = "Out of memory";
				4013	r = -ENOMEM;
				4014	goto out_unlock;
				4015	}
Mike Snitzer	583024d	2014-10-28 20:58:45 -0400	[diff] [blame]	4016	tc->thin_md = dm_table_get_md(ti->table);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	4017	spin_lock_init(&tc->lock);
Joe Thornber	a374bb2	2014-10-10 13:43:14 +0100	[diff] [blame]	4018	INIT_LIST_HEAD(&tc->deferred_cells);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	4019	bio_list_init(&tc->deferred_bio_list);
				4020	bio_list_init(&tc->retry_on_resume_list);
Mike Snitzer	67324ea	2014-03-21 18:33:41 -0400	[diff] [blame]	4021	tc->sort_bio_list = RB_ROOT;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4022
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	4023	if (argc == 3) {
				4024	r = dm_get_device(ti, argv[2], FMODE_READ, &origin_dev);
				4025	if (r) {
				4026	ti->error = "Error opening origin device";
				4027	goto bad_origin_dev;
				4028	}
				4029	tc->origin_dev = origin_dev;
				4030	}
				4031
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4032	r = dm_get_device(ti, argv[0], dm_table_get_mode(ti->table), &pool_dev);
				4033	if (r) {
				4034	ti->error = "Error opening pool device";
				4035	goto bad_pool_dev;
				4036	}
				4037	tc->pool_dev = pool_dev;
				4038
				4039	if (read_dev_id(argv[1], (unsigned long long *)&tc->dev_id, 0)) {
				4040	ti->error = "Invalid device id";
				4041	r = -EINVAL;
				4042	goto bad_common;
				4043	}
				4044
				4045	pool_md = dm_get_md(tc->pool_dev->bdev->bd_dev);
				4046	if (!pool_md) {
				4047	ti->error = "Couldn't get pool mapped device";
				4048	r = -EINVAL;
				4049	goto bad_common;
				4050	}
				4051
				4052	tc->pool = __pool_table_lookup(pool_md);
				4053	if (!tc->pool) {
				4054	ti->error = "Couldn't find pool object";
				4055	r = -EINVAL;
				4056	goto bad_pool_lookup;
				4057	}
				4058	__pool_inc(tc->pool);
				4059
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	4060	if (get_pool_mode(tc->pool) == PM_FAIL) {
				4061	ti->error = "Couldn't open thin device, Pool is in fail mode";
Mike Snitzer	1acacc0	2014-02-19 20:32:33 -0500	[diff] [blame]	4062	r = -EINVAL;
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4063	goto bad_pool;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	4064	}
				4065
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4066	r = dm_pool_open_thin_device(tc->pool->pmd, tc->dev_id, &tc->td);
				4067	if (r) {
				4068	ti->error = "Couldn't open thin internal device";
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4069	goto bad_pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4070	}
				4071
Mike Snitzer	542f903	2012-07-27 15:08:00 +0100	[diff] [blame]	4072	r = dm_set_target_max_io_len(ti, tc->pool->sectors_per_block);
				4073	if (r)
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4074	goto bad;
Mike Snitzer	542f903	2012-07-27 15:08:00 +0100	[diff] [blame]	4075
Alasdair G Kergon	55a62ee	2013-03-01 22:45:47 +0000	[diff] [blame]	4076	ti->num_flush_bios = 1;
Joe Thornber	16ad3d1	2012-07-27 15:08:07 +0100	[diff] [blame]	4077	ti->flush_supported = true;
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	4078	ti->per_bio_data_size = sizeof(struct dm_thin_endio_hook);
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	4079
				4080	/* In case the pool supports discards, pass them on. */
Mike Snitzer	b60ab99	2013-09-19 18:49:11 -0400	[diff] [blame]	4081	ti->discard_zeroes_data_unsupported = true;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	4082	if (tc->pool->pf.discard_enabled) {
Alasdair G Kergon	0ac5548	2012-07-27 15:08:08 +0100	[diff] [blame]	4083	ti->discards_supported = true;
Alasdair G Kergon	55a62ee	2013-03-01 22:45:47 +0000	[diff] [blame]	4084	ti->num_discard_bios = 1;
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	4085	ti->split_discard_bios = false;
Joe Thornber	67e2e2b	2012-03-28 18:41:29 +0100	[diff] [blame]	4086	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4087
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4088	mutex_unlock(&dm_thin_pool_table.mutex);
				4089
Joe Thornber	5e3283e	2014-04-08 11:08:41 +0100	[diff] [blame]	4090	spin_lock_irqsave(&tc->pool->lock, flags);
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4091	if (tc->pool->suspended) {
				4092	spin_unlock_irqrestore(&tc->pool->lock, flags);
				4093	mutex_lock(&dm_thin_pool_table.mutex); /* reacquire for __pool_dec */
				4094	ti->error = "Unable to activate thin device while pool is suspended";
				4095	r = -EINVAL;
				4096	goto bad;
				4097	}
Marc Dionne	2b94e89	2014-12-17 07:59:59 -0500	[diff] [blame]	4098	atomic_set(&tc->refcount, 1);
				4099	init_completion(&tc->can_destroy);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	4100	list_add_tail_rcu(&tc->list, &tc->pool->active_thins);
Joe Thornber	5e3283e	2014-04-08 11:08:41 +0100	[diff] [blame]	4101	spin_unlock_irqrestore(&tc->pool->lock, flags);
Mike Snitzer	c140e1c	2014-03-20 21:17:14 -0400	[diff] [blame]	4102	/*
				4103	* This synchronize_rcu() call is needed here otherwise we risk a
				4104	* wake_worker() call finding no bios to process (because the newly
				4105	* added tc isn't yet visible). So this reduces latency since we
				4106	* aren't then dependent on the periodic commit to wake_worker().
				4107	*/
				4108	synchronize_rcu();
				4109
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4110	dm_put(pool_md);
				4111
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4112	return 0;
				4113
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4114	bad:
Mike Snitzer	1acacc0	2014-02-19 20:32:33 -0500	[diff] [blame]	4115	dm_pool_close_thin_device(tc->td);
Mike Snitzer	80e96c5	2014-11-07 15:09:46 -0500	[diff] [blame]	4116	bad_pool:
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4117	__pool_dec(tc->pool);
				4118	bad_pool_lookup:
				4119	dm_put(pool_md);
				4120	bad_common:
				4121	dm_put_device(ti, tc->pool_dev);
				4122	bad_pool_dev:
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	4123	if (tc->origin_dev)
				4124	dm_put_device(ti, tc->origin_dev);
				4125	bad_origin_dev:
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4126	kfree(tc);
				4127	out_unlock:
				4128	mutex_unlock(&dm_thin_pool_table.mutex);
				4129
				4130	return r;
				4131	}
				4132
Mikulas Patocka	7de3ee5	2012-12-21 20:23:41 +0000	[diff] [blame]	4133	static int thin_map(struct dm_target ti, struct bio bio)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4134	{
Kent Overstreet	4f024f3	2013-10-11 15:44:27 -0700	[diff] [blame]	4135	bio->bi_iter.bi_sector = dm_target_offset(ti, bio->bi_iter.bi_sector);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4136
Mikulas Patocka	7de3ee5	2012-12-21 20:23:41 +0000	[diff] [blame]	4137	return thin_bio_map(ti, bio);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4138	}
				4139
Mikulas Patocka	7de3ee5	2012-12-21 20:23:41 +0000	[diff] [blame]	4140	static int thin_endio(struct dm_target ti, struct bio bio, int err)
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4141	{
				4142	unsigned long flags;
Mikulas Patocka	59c3d2c	2012-12-21 20:23:40 +0000	[diff] [blame]	4143	struct dm_thin_endio_hook *h = dm_per_bio_data(bio, sizeof(struct dm_thin_endio_hook));
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4144	struct list_head work;
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4145	struct dm_thin_new_mapping m, tmp;
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4146	struct pool *pool = h->tc->pool;
				4147
				4148	if (h->shared_read_entry) {
				4149	INIT_LIST_HEAD(&work);
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	4150	dm_deferred_entry_dec(h->shared_read_entry, &work);
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4151
				4152	spin_lock_irqsave(&pool->lock, flags);
				4153	list_for_each_entry_safe(m, tmp, &work, list) {
				4154	list_del(&m->list);
Joe Thornber	50f3c3e	2014-06-13 13:57:09 +0100	[diff] [blame]	4155	__complete_mapping_preparation(m);
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4156	}
				4157	spin_unlock_irqrestore(&pool->lock, flags);
				4158	}
				4159
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	4160	if (h->all_io_entry) {
				4161	INIT_LIST_HEAD(&work);
Mike Snitzer	44feb38	2012-10-12 21:02:10 +0100	[diff] [blame]	4162	dm_deferred_entry_dec(h->all_io_entry, &work);
Joe Thornber	563af18	2012-12-21 20:23:31 +0000	[diff] [blame]	4163	if (!list_empty(&work)) {
				4164	spin_lock_irqsave(&pool->lock, flags);
				4165	list_for_each_entry_safe(m, tmp, &work, list)
Mike Snitzer	daec338	2013-12-11 14:01:20 -0500	[diff] [blame]	4166	list_add_tail(&m->list, &pool->prepared_discards);
Joe Thornber	563af18	2012-12-21 20:23:31 +0000	[diff] [blame]	4167	spin_unlock_irqrestore(&pool->lock, flags);
				4168	wake_worker(pool);
				4169	}
Joe Thornber	104655f	2012-03-28 18:41:28 +0100	[diff] [blame]	4170	}
				4171
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	4172	if (h->cell)
				4173	cell_defer_no_holder(h->tc, h->cell);
				4174
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4175	return 0;
				4176	}
				4177
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	4178	static void thin_presuspend(struct dm_target *ti)
				4179	{
				4180	struct thin_c *tc = ti->private;
				4181
				4182	if (dm_noflush_suspending(ti))
				4183	noflush_work(tc, do_noflush_start);
				4184	}
				4185
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4186	static void thin_postsuspend(struct dm_target *ti)
				4187	{
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	4188	struct thin_c *tc = ti->private;
				4189
				4190	/*
				4191	* The dm_noflush_suspending flag has been cleared by now, so
				4192	* unfortunately we must always run this.
				4193	*/
				4194	noflush_work(tc, do_noflush_stop);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4195	}
				4196
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	4197	static int thin_preresume(struct dm_target *ti)
				4198	{
				4199	struct thin_c *tc = ti->private;
				4200
				4201	if (tc->origin_dev)
				4202	tc->origin_size = get_dev_size(tc->origin_dev->bdev);
				4203
				4204	return 0;
				4205	}
				4206
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4207	/*
				4208	* <nr mapped sectors> <highest mapped sector>
				4209	*/
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	4210	static void thin_status(struct dm_target *ti, status_type_t type,
				4211	unsigned status_flags, char *result, unsigned maxlen)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4212	{
				4213	int r;
				4214	ssize_t sz = 0;
				4215	dm_block_t mapped, highest;
				4216	char buf[BDEVNAME_SIZE];
				4217	struct thin_c *tc = ti->private;
				4218
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	4219	if (get_pool_mode(tc->pool) == PM_FAIL) {
				4220	DMEMIT("Fail");
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	4221	return;
Joe Thornber	e49e582	2012-07-27 15:08:16 +0100	[diff] [blame]	4222	}
				4223
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4224	if (!tc->td)
				4225	DMEMIT("-");
				4226	else {
				4227	switch (type) {
				4228	case STATUSTYPE_INFO:
				4229	r = dm_thin_get_mapped_count(tc->td, &mapped);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	4230	if (r) {
				4231	DMERR("dm_thin_get_mapped_count returned %d", r);
				4232	goto err;
				4233	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4234
				4235	r = dm_thin_get_highest_mapped_block(tc->td, &highest);
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	4236	if (r < 0) {
				4237	DMERR("dm_thin_get_highest_mapped_block returned %d", r);
				4238	goto err;
				4239	}
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4240
				4241	DMEMIT("%llu ", mapped * tc->pool->sectors_per_block);
				4242	if (r)
				4243	DMEMIT("%llu", ((highest + 1) *
				4244	tc->pool->sectors_per_block) - 1);
				4245	else
				4246	DMEMIT("-");
				4247	break;
				4248
				4249	case STATUSTYPE_TABLE:
				4250	DMEMIT("%s %lu",
				4251	format_dev_t(buf, tc->pool_dev->bdev->bd_dev),
				4252	(unsigned long) tc->dev_id);
Joe Thornber	2dd9c25	2012-03-28 18:41:28 +0100	[diff] [blame]	4253	if (tc->origin_dev)
				4254	DMEMIT(" %s", format_dev_t(buf, tc->origin_dev->bdev->bd_dev));
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4255	break;
				4256	}
				4257	}
				4258
Mikulas Patocka	fd7c092	2013-03-01 22:45:44 +0000	[diff] [blame]	4259	return;
				4260
				4261	err:
				4262	DMEMIT("Error");
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4263	}
				4264
Mike Snitzer	36f12ae	2014-10-09 15:24:12 -0400	[diff] [blame]	4265	static int thin_merge(struct dm_target ti, struct bvec_merge_data bvm,
				4266	struct bio_vec *biovec, int max_size)
				4267	{
				4268	struct thin_c *tc = ti->private;
				4269	struct request_queue *q = bdev_get_queue(tc->pool_dev->bdev);
				4270
				4271	if (!q->merge_bvec_fn)
				4272	return max_size;
				4273
				4274	bvm->bi_bdev = tc->pool_dev->bdev;
				4275	bvm->bi_sector = dm_target_offset(ti, bvm->bi_sector);
				4276
				4277	return min(max_size, q->merge_bvec_fn(q, bvm, biovec));
				4278	}
				4279
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4280	static int thin_iterate_devices(struct dm_target *ti,
				4281	iterate_devices_callout_fn fn, void *data)
				4282	{
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	4283	sector_t blocks;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4284	struct thin_c *tc = ti->private;
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	4285	struct pool *pool = tc->pool;
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4286
				4287	/*
				4288	* We can't call dm_pool_get_data_dev_size() since that blocks. So
				4289	* we follow a more convoluted path through to the pool's target.
				4290	*/
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	4291	if (!pool->ti)
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4292	return 0; /* nothing is bound */
				4293
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	4294	blocks = pool->ti->len;
				4295	(void) sector_div(blocks, pool->sectors_per_block);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4296	if (blocks)
Mike Snitzer	55f2b8b	2012-07-27 15:08:02 +0100	[diff] [blame]	4297	return fn(ti, tc->pool_dev, 0, pool->sectors_per_block * blocks, data);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4298
				4299	return 0;
				4300	}
				4301
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	4302	static void thin_io_hints(struct dm_target ti, struct queue_limits limits)
				4303	{
				4304	struct thin_c *tc = ti->private;
				4305	struct pool *pool = tc->pool;
				4306
				4307	limits->discard_granularity = pool->sectors_per_block << SECTOR_SHIFT;
				4308	limits->max_discard_sectors = 2048 * 1024 * 16; /* 16G */
				4309	}
				4310
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4311	static struct target_type thin_target = {
				4312	.name = "thin",
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	4313	.version = {1, 15, 0},
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4314	.module = THIS_MODULE,
				4315	.ctr = thin_ctr,
				4316	.dtr = thin_dtr,
				4317	.map = thin_map,
Joe Thornber	eb2aa48	2012-03-28 18:41:28 +0100	[diff] [blame]	4318	.end_io = thin_endio,
Joe Thornber	e5aea7b	2014-06-13 14:47:24 +0100	[diff] [blame]	4319	.preresume = thin_preresume,
Joe Thornber	738211f	2014-03-03 15:52:28 +0000	[diff] [blame]	4320	.presuspend = thin_presuspend,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4321	.postsuspend = thin_postsuspend,
				4322	.status = thin_status,
Mike Snitzer	36f12ae	2014-10-09 15:24:12 -0400	[diff] [blame]	4323	.merge = thin_merge,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4324	.iterate_devices = thin_iterate_devices,
Joe Thornber	34fbcf6	2015-04-16 12:58:35 +0100	[diff] [blame]	4325	.io_hints = thin_io_hints,
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4326	};
				4327
				4328	/----------------------------------------------------------------/
				4329
				4330	static int __init dm_thin_init(void)
				4331	{
				4332	int r;
				4333
				4334	pool_table_init();
				4335
				4336	r = dm_register_target(&thin_target);
				4337	if (r)
				4338	return r;
				4339
				4340	r = dm_register_target(&pool_target);
				4341	if (r)
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4342	goto bad_pool_target;
				4343
				4344	r = -ENOMEM;
				4345
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4346	_new_mapping_cache = KMEM_CACHE(dm_thin_new_mapping, 0);
				4347	if (!_new_mapping_cache)
				4348	goto bad_new_mapping_cache;
				4349
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4350	return 0;
				4351
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4352	bad_new_mapping_cache:
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4353	dm_unregister_target(&pool_target);
				4354	bad_pool_target:
				4355	dm_unregister_target(&thin_target);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4356
				4357	return r;
				4358	}
				4359
				4360	static void dm_thin_exit(void)
				4361	{
				4362	dm_unregister_target(&thin_target);
				4363	dm_unregister_target(&pool_target);
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4364
Mike Snitzer	a24c256	2012-06-03 00:30:00 +0100	[diff] [blame]	4365	kmem_cache_destroy(_new_mapping_cache);
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4366	}
				4367
				4368	module_init(dm_thin_init);
				4369	module_exit(dm_thin_exit);
				4370
Mike Snitzer	80c5789	2014-05-20 13:38:33 -0400	[diff] [blame]	4371	module_param_named(no_space_timeout, no_space_timeout_secs, uint, S_IRUGO \| S_IWUSR);
				4372	MODULE_PARM_DESC(no_space_timeout, "Out of data space queue IO timeout in seconds");
				4373
Alasdair G Kergon	7cab8bf	2012-05-12 01:43:19 +0100	[diff] [blame]	4374	MODULE_DESCRIPTION(DM_NAME " thin provisioning target");
Joe Thornber	991d9fa	2011-10-31 20:21:18 +0000	[diff] [blame]	4375	MODULE_AUTHOR("Joe Thornber <dm-devel@redhat.com>");
				4376	MODULE_LICENSE("GPL");