Blame - mm/page_cgroup.c - kernel/msm

blob: f0559e049e002e48eda0160c41a71abc18a95460 [file] [log] [blame]

KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	1	#include <linux/mm.h>
				2	#include <linux/mmzone.h>
				3	#include <linux/bootmem.h>
				4	#include <linux/bit_spinlock.h>
				5	#include <linux/page_cgroup.h>
				6	#include <linux/hash.h>
KAMEZAWA Hiroyuki	94b6da5	2008-10-22 14:15:05 -0700	[diff] [blame]	7	#include <linux/slab.h>
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	8	#include <linux/memory.h>
Paul Mundt	4c821042	2008-10-22 14:14:58 -0700	[diff] [blame]	9	#include <linux/vmalloc.h>
KAMEZAWA Hiroyuki	94b6da5	2008-10-22 14:15:05 -0700	[diff] [blame]	10	#include <linux/cgroup.h>
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	11	#include <linux/swapops.h>
Catalin Marinas	7952f98	2010-07-19 11:54:14 +0100	[diff] [blame]	12	#include <linux/kmemleak.h>
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	13
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	14	static unsigned long total_usage;
				15
				16	#if !defined(CONFIG_SPARSEMEM)
				17
				18
Al Viro	3116848	2008-11-22 17:33:24 +0000	[diff] [blame]	19	void __meminit pgdat_page_cgroup_init(struct pglist_data *pgdat)
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	20	{
				21	pgdat->node_page_cgroup = NULL;
				22	}
				23
				24	struct page_cgroup lookup_page_cgroup(struct page page)
				25	{
				26	unsigned long pfn = page_to_pfn(page);
				27	unsigned long offset;
				28	struct page_cgroup *base;
				29
				30	base = NODE_DATA(page_to_nid(page))->node_page_cgroup;
				31	if (unlikely(!base))
				32	return NULL;
				33
				34	offset = pfn - NODE_DATA(page_to_nid(page))->node_start_pfn;
				35	return base + offset;
				36	}
				37
				38	static int __init alloc_node_page_cgroup(int nid)
				39	{
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	40	struct page_cgroup *base;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	41	unsigned long table_size;
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	42	unsigned long nr_pages;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	43
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	44	nr_pages = NODE_DATA(nid)->node_spanned_pages;
KAMEZAWA Hiroyuki	653d22c	2008-12-09 13:14:20 -0800	[diff] [blame]	45	if (!nr_pages)
				46	return 0;
				47
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	48	table_size = sizeof(struct page_cgroup) * nr_pages;
KAMEZAWA Hiroyuki	ca371c0	2009-06-12 10:33:53 +0300	[diff] [blame]	49
				50	base = __alloc_bootmem_node_nopanic(NODE_DATA(nid),
				51	table_size, PAGE_SIZE, __pa(MAX_DMA_ADDRESS));
				52	if (!base)
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	53	return -ENOMEM;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	54	NODE_DATA(nid)->node_page_cgroup = base;
				55	total_usage += table_size;
				56	return 0;
				57	}
				58
KAMEZAWA Hiroyuki	ca371c0	2009-06-12 10:33:53 +0300	[diff] [blame]	59	void __init page_cgroup_init_flatmem(void)
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	60	{
				61
				62	int nid, fail;
				63
Hirokazu Takahashi	f8d6654	2009-01-07 18:08:02 -0800	[diff] [blame]	64	if (mem_cgroup_disabled())
KAMEZAWA Hiroyuki	94b6da5	2008-10-22 14:15:05 -0700	[diff] [blame]	65	return;
				66
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	67	for_each_online_node(nid) {
				68	fail = alloc_node_page_cgroup(nid);
				69	if (fail)
				70	goto fail;
				71	}
				72	printk(KERN_INFO "allocated %ld bytes of page_cgroup\n", total_usage);
Randy Dunlap	8ca739e	2009-06-17 16:26:32 -0700	[diff] [blame]	73	printk(KERN_INFO "please try 'cgroup_disable=memory' option if you"
				74	" don't want memory cgroups\n");
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	75	return;
				76	fail:
Randy Dunlap	8ca739e	2009-06-17 16:26:32 -0700	[diff] [blame]	77	printk(KERN_CRIT "allocation of page_cgroup failed.\n");
				78	printk(KERN_CRIT "please try 'cgroup_disable=memory' boot option\n");
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	79	panic("Out of memory");
				80	}
				81
				82	#else /* CONFIG_FLAT_NODE_MEM_MAP */
				83
				84	struct page_cgroup lookup_page_cgroup(struct page page)
				85	{
				86	unsigned long pfn = page_to_pfn(page);
				87	struct mem_section *section = __pfn_to_section(pfn);
				88
Balbir Singh	d69b042	2009-06-17 16:26:34 -0700	[diff] [blame]	89	if (!section->page_cgroup)
				90	return NULL;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	91	return section->page_cgroup + pfn;
				92	}
				93
Namhyung Kim	268433b	2011-05-26 16:25:29 -0700	[diff] [blame]	94	static void *__meminit alloc_page_cgroup(size_t size, int nid)
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	95	{
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	96	gfp_t flags = GFP_KERNEL \| __GFP_ZERO \| __GFP_NOWARN;
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	97	void *addr = NULL;
				98
Steven Rostedt	ff7ee93	2011-11-02 13:38:11 -0700	[diff] [blame]	99	addr = alloc_pages_exact_nid(nid, size, flags);
				100	if (addr) {
				101	kmemleak_alloc(addr, size, 1, flags);
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	102	return addr;
Steven Rostedt	ff7ee93	2011-11-02 13:38:11 -0700	[diff] [blame]	103	}
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	104
				105	if (node_state(nid, N_HIGH_MEMORY))
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	106	addr = vzalloc_node(size, nid);
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	107	else
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	108	addr = vzalloc(size);
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	109
				110	return addr;
				111	}
				112
				113	#ifdef CONFIG_MEMORY_HOTPLUG
				114	static void free_page_cgroup(void *addr)
				115	{
				116	if (is_vmalloc_addr(addr)) {
				117	vfree(addr);
				118	} else {
				119	struct page *page = virt_to_page(addr);
Michal Hocko	6cfddb2	2011-03-23 16:42:41 -0700	[diff] [blame]	120	size_t table_size =
				121	sizeof(struct page_cgroup) * PAGES_PER_SECTION;
				122
				123	BUG_ON(PageReserved(page));
				124	free_pages_exact(addr, table_size);
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	125	}
				126	}
				127	#endif
				128
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	129	static int __meminit init_section_page_cgroup(unsigned long pfn, int nid)
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	130	{
Johannes Weiner	6b3ae58	2011-03-23 16:42:30 -0700	[diff] [blame]	131	struct mem_section *section;
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	132	struct page_cgroup *base;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	133	unsigned long table_size;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	134
Johannes Weiner	6b208e3	2012-01-12 17:18:18 -0800	[diff] [blame^]	135	section = __pfn_to_section(pfn);
Johannes Weiner	6b3ae58	2011-03-23 16:42:30 -0700	[diff] [blame]	136
				137	if (section->page_cgroup)
				138	return 0;
				139
Johannes Weiner	6b3ae58	2011-03-23 16:42:30 -0700	[diff] [blame]	140	table_size = sizeof(struct page_cgroup) * PAGES_PER_SECTION;
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	141	base = alloc_page_cgroup(table_size, nid);
				142
Johannes Weiner	6b3ae58	2011-03-23 16:42:30 -0700	[diff] [blame]	143	/*
				144	* The value stored in section->page_cgroup is (base - pfn)
				145	* and it does not point to the memory block allocated above,
				146	* causing kmemleak false positives.
				147	*/
				148	kmemleak_not_leak(base);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	149
				150	if (!base) {
				151	printk(KERN_ERR "page cgroup allocation failure\n");
				152	return -ENOMEM;
				153	}
				154
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	155	/*
				156	* The passed "pfn" may not be aligned to SECTION. For the calculation
				157	* we need to apply a mask.
				158	*/
				159	pfn &= PAGE_SECTION_MASK;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	160	section->page_cgroup = base - pfn;
				161	total_usage += table_size;
				162	return 0;
				163	}
				164	#ifdef CONFIG_MEMORY_HOTPLUG
				165	void __free_page_cgroup(unsigned long pfn)
				166	{
				167	struct mem_section *ms;
				168	struct page_cgroup *base;
				169
				170	ms = __pfn_to_section(pfn);
				171	if (!ms \|\| !ms->page_cgroup)
				172	return;
				173	base = ms->page_cgroup + pfn;
Michal Hocko	dde79e0	2011-03-23 16:42:40 -0700	[diff] [blame]	174	free_page_cgroup(base);
				175	ms->page_cgroup = NULL;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	176	}
				177
Al Viro	3116848	2008-11-22 17:33:24 +0000	[diff] [blame]	178	int __meminit online_page_cgroup(unsigned long start_pfn,
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	179	unsigned long nr_pages,
				180	int nid)
				181	{
				182	unsigned long start, end, pfn;
				183	int fail = 0;
				184
Daniel Kiper	1bb36fb	2011-07-25 17:12:13 -0700	[diff] [blame]	185	start = SECTION_ALIGN_DOWN(start_pfn);
				186	end = SECTION_ALIGN_UP(start_pfn + nr_pages);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	187
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	188	if (nid == -1) {
				189	/*
				190	* In this case, "nid" already exists and contains valid memory.
				191	* "start_pfn" passed to us is a pfn which is an arg for
				192	* online__pages(), and start_pfn should exist.
				193	*/
				194	nid = pfn_to_nid(start_pfn);
				195	VM_BUG_ON(!node_state(nid, N_ONLINE));
				196	}
				197
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	198	for (pfn = start; !fail && pfn < end; pfn += PAGES_PER_SECTION) {
				199	if (!pfn_present(pfn))
				200	continue;
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	201	fail = init_section_page_cgroup(pfn, nid);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	202	}
				203	if (!fail)
				204	return 0;
				205
				206	/* rollback */
				207	for (pfn = start; pfn < end; pfn += PAGES_PER_SECTION)
				208	__free_page_cgroup(pfn);
				209
				210	return -ENOMEM;
				211	}
				212
Al Viro	3116848	2008-11-22 17:33:24 +0000	[diff] [blame]	213	int __meminit offline_page_cgroup(unsigned long start_pfn,
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	214	unsigned long nr_pages, int nid)
				215	{
				216	unsigned long start, end, pfn;
				217
Daniel Kiper	1bb36fb	2011-07-25 17:12:13 -0700	[diff] [blame]	218	start = SECTION_ALIGN_DOWN(start_pfn);
				219	end = SECTION_ALIGN_UP(start_pfn + nr_pages);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	220
				221	for (pfn = start; pfn < end; pfn += PAGES_PER_SECTION)
				222	__free_page_cgroup(pfn);
				223	return 0;
				224
				225	}
				226
Al Viro	3116848	2008-11-22 17:33:24 +0000	[diff] [blame]	227	static int __meminit page_cgroup_callback(struct notifier_block *self,
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	228	unsigned long action, void *arg)
				229	{
				230	struct memory_notify *mn = arg;
				231	int ret = 0;
				232	switch (action) {
				233	case MEM_GOING_ONLINE:
				234	ret = online_page_cgroup(mn->start_pfn,
				235	mn->nr_pages, mn->status_change_nid);
				236	break;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	237	case MEM_OFFLINE:
				238	offline_page_cgroup(mn->start_pfn,
				239	mn->nr_pages, mn->status_change_nid);
				240	break;
KAMEZAWA Hiroyuki	dc19f9d	2008-12-01 13:13:48 -0800	[diff] [blame]	241	case MEM_CANCEL_ONLINE:
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	242	case MEM_GOING_OFFLINE:
				243	break;
				244	case MEM_ONLINE:
				245	case MEM_CANCEL_OFFLINE:
				246	break;
				247	}
KAMEZAWA Hiroyuki	dc19f9d	2008-12-01 13:13:48 -0800	[diff] [blame]	248
Prarit Bhargava	5fda1bd	2011-03-22 16:30:49 -0700	[diff] [blame]	249	return notifier_from_errno(ret);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	250	}
				251
				252	#endif
				253
				254	void __init page_cgroup_init(void)
				255	{
				256	unsigned long pfn;
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	257	int nid;
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	258
Hirokazu Takahashi	f8d6654	2009-01-07 18:08:02 -0800	[diff] [blame]	259	if (mem_cgroup_disabled())
KAMEZAWA Hiroyuki	94b6da5	2008-10-22 14:15:05 -0700	[diff] [blame]	260	return;
				261
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	262	for_each_node_state(nid, N_HIGH_MEMORY) {
				263	unsigned long start_pfn, end_pfn;
				264
				265	start_pfn = node_start_pfn(nid);
				266	end_pfn = node_end_pfn(nid);
				267	/*
				268	* start_pfn and end_pfn may not be aligned to SECTION and the
				269	* page->flags of out of node pages are not initialized. So we
				270	* scan [start_pfn, the biggest section's pfn < end_pfn) here.
				271	*/
				272	for (pfn = start_pfn;
				273	pfn < end_pfn;
				274	pfn = ALIGN(pfn + 1, PAGES_PER_SECTION)) {
				275
				276	if (!pfn_valid(pfn))
				277	continue;
				278	/*
				279	* Nodes's pfns can be overlapping.
				280	* We know some arch can have a nodes layout such as
				281	* -------------pfn-------------->
				282	* N0 \| N1 \| N2 \| N0 \| N1 \| N2\|....
				283	*/
				284	if (pfn_to_nid(pfn) != nid)
				285	continue;
				286	if (init_section_page_cgroup(pfn, nid))
				287	goto oom;
				288	}
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	289	}
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	290	hotplug_memory_notifier(page_cgroup_callback, 0);
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	291	printk(KERN_INFO "allocated %ld bytes of page_cgroup\n", total_usage);
KAMEZAWA Hiroyuki	37573e8	2011-06-15 15:08:42 -0700	[diff] [blame]	292	printk(KERN_INFO "please try 'cgroup_disable=memory' option if you "
				293	"don't want memory cgroups\n");
				294	return;
				295	oom:
				296	printk(KERN_CRIT "try 'cgroup_disable=memory' boot option\n");
				297	panic("Out of memory");
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	298	}
				299
Al Viro	3116848	2008-11-22 17:33:24 +0000	[diff] [blame]	300	void __meminit pgdat_page_cgroup_init(struct pglist_data *pgdat)
KAMEZAWA Hiroyuki	52d4b9a	2008-10-18 20:28:16 -0700	[diff] [blame]	301	{
				302	return;
				303	}
				304
				305	#endif
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	306
				307
				308	#ifdef CONFIG_CGROUP_MEM_RES_CTLR_SWAP
				309
				310	static DEFINE_MUTEX(swap_cgroup_mutex);
				311	struct swap_cgroup_ctrl {
				312	struct page **map;
				313	unsigned long length;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	314	spinlock_t lock;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	315	};
				316
H Hartley Sweeten	61600f5	2011-11-02 13:38:36 -0700	[diff] [blame]	317	static struct swap_cgroup_ctrl swap_cgroup_ctrl[MAX_SWAPFILES];
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	318
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	319	struct swap_cgroup {
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	320	unsigned short id;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	321	};
				322	#define SC_PER_PAGE (PAGE_SIZE/sizeof(struct swap_cgroup))
				323	#define SC_POS_MASK (SC_PER_PAGE - 1)
				324
				325	/*
				326	* SwapCgroup implements "lookup" and "exchange" operations.
				327	* In typical usage, this swap_cgroup is accessed via memcg's charge/uncharge
				328	* against SwapCache. At swap_free(), this is accessed directly from swap.
				329	*
				330	* This means,
				331	* - we have no race in "exchange" when we're accessed via SwapCache because
				332	* SwapCache(and its swp_entry) is under lock.
				333	* - When called via swap_free(), there is no user of this entry and no race.
				334	* Then, we don't need lock around "exchange".
				335	*
				336	* TODO: we can push these buffers out to HIGHMEM.
				337	*/
				338
				339	/*
				340	* allocate buffer for swap_cgroup.
				341	*/
				342	static int swap_cgroup_prepare(int type)
				343	{
				344	struct page *page;
				345	struct swap_cgroup_ctrl *ctrl;
				346	unsigned long idx, max;
				347
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	348	ctrl = &swap_cgroup_ctrl[type];
				349
				350	for (idx = 0; idx < ctrl->length; idx++) {
				351	page = alloc_page(GFP_KERNEL \| __GFP_ZERO);
				352	if (!page)
				353	goto not_enough_page;
				354	ctrl->map[idx] = page;
				355	}
				356	return 0;
				357	not_enough_page:
				358	max = idx;
				359	for (idx = 0; idx < max; idx++)
				360	__free_page(ctrl->map[idx]);
				361
				362	return -ENOMEM;
				363	}
				364
				365	/**
Daisuke Nishimura	0249144	2010-03-10 15:22:17 -0800	[diff] [blame]	366	* swap_cgroup_cmpxchg - cmpxchg mem_cgroup's id for this swp_entry.
				367	* @end: swap entry to be cmpxchged
				368	* @old: old id
				369	* @new: new id
				370	*
				371	* Returns old id at success, 0 at failure.
Lucas De Marchi	25985ed	2011-03-30 22:57:33 -0300	[diff] [blame]	372	* (There is no mem_cgroup using 0 as its id)
Daisuke Nishimura	0249144	2010-03-10 15:22:17 -0800	[diff] [blame]	373	*/
				374	unsigned short swap_cgroup_cmpxchg(swp_entry_t ent,
				375	unsigned short old, unsigned short new)
				376	{
				377	int type = swp_type(ent);
				378	unsigned long offset = swp_offset(ent);
				379	unsigned long idx = offset / SC_PER_PAGE;
				380	unsigned long pos = offset & SC_POS_MASK;
				381	struct swap_cgroup_ctrl *ctrl;
				382	struct page *mappage;
				383	struct swap_cgroup *sc;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	384	unsigned long flags;
				385	unsigned short retval;
Daisuke Nishimura	0249144	2010-03-10 15:22:17 -0800	[diff] [blame]	386
				387	ctrl = &swap_cgroup_ctrl[type];
				388
				389	mappage = ctrl->map[idx];
				390	sc = page_address(mappage);
				391	sc += pos;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	392	spin_lock_irqsave(&ctrl->lock, flags);
				393	retval = sc->id;
				394	if (retval == old)
				395	sc->id = new;
Daisuke Nishimura	0249144	2010-03-10 15:22:17 -0800	[diff] [blame]	396	else
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	397	retval = 0;
				398	spin_unlock_irqrestore(&ctrl->lock, flags);
				399	return retval;
Daisuke Nishimura	0249144	2010-03-10 15:22:17 -0800	[diff] [blame]	400	}
				401
				402	/**
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	403	* swap_cgroup_record - record mem_cgroup for this swp_entry.
				404	* @ent: swap entry to be recorded into
				405	* @mem: mem_cgroup to be recorded
				406	*
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	407	* Returns old value at success, 0 at failure.
				408	* (Of course, old value can be 0.)
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	409	*/
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	410	unsigned short swap_cgroup_record(swp_entry_t ent, unsigned short id)
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	411	{
				412	int type = swp_type(ent);
				413	unsigned long offset = swp_offset(ent);
				414	unsigned long idx = offset / SC_PER_PAGE;
				415	unsigned long pos = offset & SC_POS_MASK;
				416	struct swap_cgroup_ctrl *ctrl;
				417	struct page *mappage;
				418	struct swap_cgroup *sc;
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	419	unsigned short old;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	420	unsigned long flags;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	421
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	422	ctrl = &swap_cgroup_ctrl[type];
				423
				424	mappage = ctrl->map[idx];
				425	sc = page_address(mappage);
				426	sc += pos;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	427	spin_lock_irqsave(&ctrl->lock, flags);
				428	old = sc->id;
				429	sc->id = id;
				430	spin_unlock_irqrestore(&ctrl->lock, flags);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	431
				432	return old;
				433	}
				434
				435	/**
				436	* lookup_swap_cgroup - lookup mem_cgroup tied to swap entry
				437	* @ent: swap entry to be looked up.
				438	*
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	439	* Returns CSS ID of mem_cgroup at success. 0 at failure. (0 is invalid ID)
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	440	*/
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	441	unsigned short lookup_swap_cgroup(swp_entry_t ent)
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	442	{
				443	int type = swp_type(ent);
				444	unsigned long offset = swp_offset(ent);
				445	unsigned long idx = offset / SC_PER_PAGE;
				446	unsigned long pos = offset & SC_POS_MASK;
				447	struct swap_cgroup_ctrl *ctrl;
				448	struct page *mappage;
				449	struct swap_cgroup *sc;
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	450	unsigned short ret;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	451
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	452	ctrl = &swap_cgroup_ctrl[type];
				453	mappage = ctrl->map[idx];
				454	sc = page_address(mappage);
				455	sc += pos;
KAMEZAWA Hiroyuki	a3b2d69	2009-04-02 16:57:45 -0700	[diff] [blame]	456	ret = sc->id;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	457	return ret;
				458	}
				459
				460	int swap_cgroup_swapon(int type, unsigned long max_pages)
				461	{
				462	void *array;
				463	unsigned long array_size;
				464	unsigned long length;
				465	struct swap_cgroup_ctrl *ctrl;
				466
				467	if (!do_swap_account)
				468	return 0;
				469
Namhyung Kim	33278f7	2011-05-26 16:25:30 -0700	[diff] [blame]	470	length = DIV_ROUND_UP(max_pages, SC_PER_PAGE);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	471	array_size = length * sizeof(void *);
				472
Joe Perches	8c1fec1	2011-05-28 10:36:34 -0700	[diff] [blame]	473	array = vzalloc(array_size);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	474	if (!array)
				475	goto nomem;
				476
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	477	ctrl = &swap_cgroup_ctrl[type];
				478	mutex_lock(&swap_cgroup_mutex);
				479	ctrl->length = length;
				480	ctrl->map = array;
KAMEZAWA Hiroyuki	e9e58a4	2010-03-15 00:34:57 -0400	[diff] [blame]	481	spin_lock_init(&ctrl->lock);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	482	if (swap_cgroup_prepare(type)) {
				483	/* memory shortage */
				484	ctrl->map = NULL;
				485	ctrl->length = 0;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	486	mutex_unlock(&swap_cgroup_mutex);
Namhyung Kim	6a5b18d	2011-05-26 16:25:31 -0700	[diff] [blame]	487	vfree(array);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	488	goto nomem;
				489	}
				490	mutex_unlock(&swap_cgroup_mutex);
				491
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	492	return 0;
				493	nomem:
				494	printk(KERN_INFO "couldn't allocate enough memory for swap_cgroup.\n");
				495	printk(KERN_INFO
WANG Cong	00a66d2	2011-07-25 17:12:12 -0700	[diff] [blame]	496	"swap_cgroup can be disabled by swapaccount=0 boot option\n");
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	497	return -ENOMEM;
				498	}
				499
				500	void swap_cgroup_swapoff(int type)
				501	{
Namhyung Kim	6a5b18d	2011-05-26 16:25:31 -0700	[diff] [blame]	502	struct page **map;
				503	unsigned long i, length;
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	504	struct swap_cgroup_ctrl *ctrl;
				505
				506	if (!do_swap_account)
				507	return;
				508
				509	mutex_lock(&swap_cgroup_mutex);
				510	ctrl = &swap_cgroup_ctrl[type];
Namhyung Kim	6a5b18d	2011-05-26 16:25:31 -0700	[diff] [blame]	511	map = ctrl->map;
				512	length = ctrl->length;
				513	ctrl->map = NULL;
				514	ctrl->length = 0;
				515	mutex_unlock(&swap_cgroup_mutex);
				516
				517	if (map) {
				518	for (i = 0; i < length; i++) {
				519	struct page *page = map[i];
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	520	if (page)
				521	__free_page(page);
				522	}
Namhyung Kim	6a5b18d	2011-05-26 16:25:31 -0700	[diff] [blame]	523	vfree(map);
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	524	}
KAMEZAWA Hiroyuki	27a7faa	2009-01-07 18:07:58 -0800	[diff] [blame]	525	}
				526
				527	#endif