Blame - test/CodeGen/ARM/vldlane.ll - fp2-dev/platform/external/llvm

blob: 97ab399043a529566a85f78a27d8c0263e0527df [file] [log] [blame]

Dan Gohman	fce288f	2009-09-09 00:09:15 +0000	[diff] [blame]	1	; RUN: llc < %s -march=arm -mattr=+neon \| FileCheck %s
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	2
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	3	define <8 x i8> @vld1lanei8(i8* %A, <8 x i8>* %B) nounwind {
				4	;CHECK: vld1lanei8:
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	5	;Check the (default) alignment value.
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	6	;CHECK: vld1.8 {d16[3]}, [r0]
				7	%tmp1 = load <8 x i8>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	8	%tmp2 = load i8* %A, align 8
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	9	%tmp3 = insertelement <8 x i8> %tmp1, i8 %tmp2, i32 3
				10	ret <8 x i8> %tmp3
				11	}
				12
				13	define <4 x i16> @vld1lanei16(i16* %A, <4 x i16>* %B) nounwind {
				14	;CHECK: vld1lanei16:
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	15	;Check the alignment value. Max for this instruction is 16 bits:
				16	;CHECK: vld1.16 {d16[2]}, [r0, :16]
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	17	%tmp1 = load <4 x i16>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	18	%tmp2 = load i16* %A, align 8
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	19	%tmp3 = insertelement <4 x i16> %tmp1, i16 %tmp2, i32 2
				20	ret <4 x i16> %tmp3
				21	}
				22
				23	define <2 x i32> @vld1lanei32(i32* %A, <2 x i32>* %B) nounwind {
				24	;CHECK: vld1lanei32:
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	25	;Check the alignment value. Max for this instruction is 16 bits:
				26	;CHECK: vld1.32 {d16[1]}, [r0, :32]
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	27	%tmp1 = load <2 x i32>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	28	%tmp2 = load i32* %A, align 8
Bob Wilson	b796bbb	2010-11-01 22:04:05 +0000	[diff] [blame]	29	%tmp3 = insertelement <2 x i32> %tmp1, i32 %tmp2, i32 1
				30	ret <2 x i32> %tmp3
				31	}
				32
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	33	define <16 x i8> @vld1laneQi8(i8* %A, <16 x i8>* %B) nounwind {
				34	;CHECK: vld1laneQi8:
				35	;CHECK: vld1.8 {d17[1]}, [r0]
				36	%tmp1 = load <16 x i8>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	37	%tmp2 = load i8* %A, align 8
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	38	%tmp3 = insertelement <16 x i8> %tmp1, i8 %tmp2, i32 9
				39	ret <16 x i8> %tmp3
				40	}
				41
				42	define <8 x i16> @vld1laneQi16(i16* %A, <8 x i16>* %B) nounwind {
				43	;CHECK: vld1laneQi16:
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	44	;CHECK: vld1.16 {d17[1]}, [r0, :16]
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	45	%tmp1 = load <8 x i16>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	46	%tmp2 = load i16* %A, align 8
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	47	%tmp3 = insertelement <8 x i16> %tmp1, i16 %tmp2, i32 5
				48	ret <8 x i16> %tmp3
				49	}
				50
				51	define <4 x i32> @vld1laneQi32(i32* %A, <4 x i32>* %B) nounwind {
				52	;CHECK: vld1laneQi32:
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	53	;CHECK: vld1.32 {d17[1]}, [r0, :32]
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	54	%tmp1 = load <4 x i32>* %B
Bob Wilson	665814b	2010-11-01 23:40:51 +0000	[diff] [blame^]	55	%tmp2 = load i32* %A, align 8
Bob Wilson	baf0615	2010-11-01 23:40:46 +0000	[diff] [blame]	56	%tmp3 = insertelement <4 x i32> %tmp1, i32 %tmp2, i32 3
				57	ret <4 x i32> %tmp3
				58	}
				59
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	60	%struct.__neon_int8x8x2_t = type { <8 x i8>, <8 x i8> }
				61	%struct.__neon_int16x4x2_t = type { <4 x i16>, <4 x i16> }
				62	%struct.__neon_int32x2x2_t = type { <2 x i32>, <2 x i32> }
				63	%struct.__neon_float32x2x2_t = type { <2 x float>, <2 x float> }
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	64
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	65	%struct.__neon_int16x8x2_t = type { <8 x i16>, <8 x i16> }
				66	%struct.__neon_int32x4x2_t = type { <4 x i32>, <4 x i32> }
				67	%struct.__neon_float32x4x2_t = type { <4 x float>, <4 x float> }
				68
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	69	define <8 x i8> @vld2lanei8(i8* %A, <8 x i8>* %B) nounwind {
				70	;CHECK: vld2lanei8:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	71	;Check the alignment value. Max for this instruction is 16 bits:
				72	;CHECK: vld2.8 {d16[1], d17[1]}, [r0, :16]
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	73	%tmp1 = load <8 x i8>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	74	%tmp2 = call %struct.__neon_int8x8x2_t @llvm.arm.neon.vld2lane.v8i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 4)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	75	%tmp3 = extractvalue %struct.__neon_int8x8x2_t %tmp2, 0
				76	%tmp4 = extractvalue %struct.__neon_int8x8x2_t %tmp2, 1
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	77	%tmp5 = add <8 x i8> %tmp3, %tmp4
				78	ret <8 x i8> %tmp5
				79	}
				80
				81	define <4 x i16> @vld2lanei16(i16* %A, <4 x i16>* %B) nounwind {
				82	;CHECK: vld2lanei16:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	83	;Check the alignment value. Max for this instruction is 32 bits:
				84	;CHECK: vld2.16 {d16[1], d17[1]}, [r0, :32]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	85	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	86	%tmp1 = load <4 x i16>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	87	%tmp2 = call %struct.__neon_int16x4x2_t @llvm.arm.neon.vld2lane.v4i16(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 8)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	88	%tmp3 = extractvalue %struct.__neon_int16x4x2_t %tmp2, 0
				89	%tmp4 = extractvalue %struct.__neon_int16x4x2_t %tmp2, 1
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	90	%tmp5 = add <4 x i16> %tmp3, %tmp4
				91	ret <4 x i16> %tmp5
				92	}
				93
				94	define <2 x i32> @vld2lanei32(i32* %A, <2 x i32>* %B) nounwind {
				95	;CHECK: vld2lanei32:
				96	;CHECK: vld2.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	97	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	98	%tmp1 = load <2 x i32>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	99	%tmp2 = call %struct.__neon_int32x2x2_t @llvm.arm.neon.vld2lane.v2i32(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	100	%tmp3 = extractvalue %struct.__neon_int32x2x2_t %tmp2, 0
				101	%tmp4 = extractvalue %struct.__neon_int32x2x2_t %tmp2, 1
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	102	%tmp5 = add <2 x i32> %tmp3, %tmp4
				103	ret <2 x i32> %tmp5
				104	}
				105
				106	define <2 x float> @vld2lanef(float* %A, <2 x float>* %B) nounwind {
				107	;CHECK: vld2lanef:
				108	;CHECK: vld2.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	109	%tmp0 = bitcast float* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	110	%tmp1 = load <2 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	111	%tmp2 = call %struct.__neon_float32x2x2_t @llvm.arm.neon.vld2lane.v2f32(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	112	%tmp3 = extractvalue %struct.__neon_float32x2x2_t %tmp2, 0
				113	%tmp4 = extractvalue %struct.__neon_float32x2x2_t %tmp2, 1
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	114	%tmp5 = fadd <2 x float> %tmp3, %tmp4
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	115	ret <2 x float> %tmp5
				116	}
				117
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	118	define <8 x i16> @vld2laneQi16(i16* %A, <8 x i16>* %B) nounwind {
				119	;CHECK: vld2laneQi16:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	120	;Check the (default) alignment.
				121	;CHECK: vld2.16 {d17[1], d19[1]}, [r0]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	122	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	123	%tmp1 = load <8 x i16>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	124	%tmp2 = call %struct.__neon_int16x8x2_t @llvm.arm.neon.vld2lane.v8i16(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 5, i32 1)
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	125	%tmp3 = extractvalue %struct.__neon_int16x8x2_t %tmp2, 0
				126	%tmp4 = extractvalue %struct.__neon_int16x8x2_t %tmp2, 1
				127	%tmp5 = add <8 x i16> %tmp3, %tmp4
				128	ret <8 x i16> %tmp5
				129	}
				130
				131	define <4 x i32> @vld2laneQi32(i32* %A, <4 x i32>* %B) nounwind {
				132	;CHECK: vld2laneQi32:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	133	;Check the alignment value. Max for this instruction is 64 bits:
				134	;CHECK: vld2.32 {d17[0], d19[0]}, [r0, :64]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	135	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	136	%tmp1 = load <4 x i32>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	137	%tmp2 = call %struct.__neon_int32x4x2_t @llvm.arm.neon.vld2lane.v4i32(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 2, i32 16)
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	138	%tmp3 = extractvalue %struct.__neon_int32x4x2_t %tmp2, 0
				139	%tmp4 = extractvalue %struct.__neon_int32x4x2_t %tmp2, 1
				140	%tmp5 = add <4 x i32> %tmp3, %tmp4
				141	ret <4 x i32> %tmp5
				142	}
				143
				144	define <4 x float> @vld2laneQf(float* %A, <4 x float>* %B) nounwind {
				145	;CHECK: vld2laneQf:
				146	;CHECK: vld2.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	147	%tmp0 = bitcast float* %A to i8*
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	148	%tmp1 = load <4 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	149	%tmp2 = call %struct.__neon_float32x4x2_t @llvm.arm.neon.vld2lane.v4f32(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	150	%tmp3 = extractvalue %struct.__neon_float32x4x2_t %tmp2, 0
				151	%tmp4 = extractvalue %struct.__neon_float32x4x2_t %tmp2, 1
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	152	%tmp5 = fadd <4 x float> %tmp3, %tmp4
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	153	ret <4 x float> %tmp5
				154	}
				155
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	156	declare %struct.__neon_int8x8x2_t @llvm.arm.neon.vld2lane.v8i8(i8*, <8 x i8>, <8 x i8>, i32, i32) nounwind readonly
				157	declare %struct.__neon_int16x4x2_t @llvm.arm.neon.vld2lane.v4i16(i8*, <4 x i16>, <4 x i16>, i32, i32) nounwind readonly
				158	declare %struct.__neon_int32x2x2_t @llvm.arm.neon.vld2lane.v2i32(i8*, <2 x i32>, <2 x i32>, i32, i32) nounwind readonly
				159	declare %struct.__neon_float32x2x2_t @llvm.arm.neon.vld2lane.v2f32(i8*, <2 x float>, <2 x float>, i32, i32) nounwind readonly
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	160
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	161	declare %struct.__neon_int16x8x2_t @llvm.arm.neon.vld2lane.v8i16(i8*, <8 x i16>, <8 x i16>, i32, i32) nounwind readonly
				162	declare %struct.__neon_int32x4x2_t @llvm.arm.neon.vld2lane.v4i32(i8*, <4 x i32>, <4 x i32>, i32, i32) nounwind readonly
				163	declare %struct.__neon_float32x4x2_t @llvm.arm.neon.vld2lane.v4f32(i8*, <4 x float>, <4 x float>, i32, i32) nounwind readonly
Bob Wilson	30aea9d	2009-10-08 18:56:10 +0000	[diff] [blame]	164
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	165	%struct.__neon_int8x8x3_t = type { <8 x i8>, <8 x i8>, <8 x i8> }
				166	%struct.__neon_int16x4x3_t = type { <4 x i16>, <4 x i16>, <4 x i16> }
				167	%struct.__neon_int32x2x3_t = type { <2 x i32>, <2 x i32>, <2 x i32> }
				168	%struct.__neon_float32x2x3_t = type { <2 x float>, <2 x float>, <2 x float> }
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	169
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	170	%struct.__neon_int16x8x3_t = type { <8 x i16>, <8 x i16>, <8 x i16> }
				171	%struct.__neon_int32x4x3_t = type { <4 x i32>, <4 x i32>, <4 x i32> }
				172	%struct.__neon_float32x4x3_t = type { <4 x float>, <4 x float>, <4 x float> }
				173
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	174	define <8 x i8> @vld3lanei8(i8* %A, <8 x i8>* %B) nounwind {
				175	;CHECK: vld3lanei8:
				176	;CHECK: vld3.8
				177	%tmp1 = load <8 x i8>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	178	%tmp2 = call %struct.__neon_int8x8x3_t @llvm.arm.neon.vld3lane.v8i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	179	%tmp3 = extractvalue %struct.__neon_int8x8x3_t %tmp2, 0
				180	%tmp4 = extractvalue %struct.__neon_int8x8x3_t %tmp2, 1
				181	%tmp5 = extractvalue %struct.__neon_int8x8x3_t %tmp2, 2
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	182	%tmp6 = add <8 x i8> %tmp3, %tmp4
				183	%tmp7 = add <8 x i8> %tmp5, %tmp6
				184	ret <8 x i8> %tmp7
				185	}
				186
				187	define <4 x i16> @vld3lanei16(i16* %A, <4 x i16>* %B) nounwind {
				188	;CHECK: vld3lanei16:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	189	;Check the (default) alignment value. VLD3 does not support alignment.
				190	;CHECK: vld3.16 {d16[1], d17[1], d18[1]}, [r0]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	191	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	192	%tmp1 = load <4 x i16>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	193	%tmp2 = call %struct.__neon_int16x4x3_t @llvm.arm.neon.vld3lane.v4i16(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 8)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	194	%tmp3 = extractvalue %struct.__neon_int16x4x3_t %tmp2, 0
				195	%tmp4 = extractvalue %struct.__neon_int16x4x3_t %tmp2, 1
				196	%tmp5 = extractvalue %struct.__neon_int16x4x3_t %tmp2, 2
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	197	%tmp6 = add <4 x i16> %tmp3, %tmp4
				198	%tmp7 = add <4 x i16> %tmp5, %tmp6
				199	ret <4 x i16> %tmp7
				200	}
				201
				202	define <2 x i32> @vld3lanei32(i32* %A, <2 x i32>* %B) nounwind {
				203	;CHECK: vld3lanei32:
				204	;CHECK: vld3.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	205	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	206	%tmp1 = load <2 x i32>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	207	%tmp2 = call %struct.__neon_int32x2x3_t @llvm.arm.neon.vld3lane.v2i32(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	208	%tmp3 = extractvalue %struct.__neon_int32x2x3_t %tmp2, 0
				209	%tmp4 = extractvalue %struct.__neon_int32x2x3_t %tmp2, 1
				210	%tmp5 = extractvalue %struct.__neon_int32x2x3_t %tmp2, 2
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	211	%tmp6 = add <2 x i32> %tmp3, %tmp4
				212	%tmp7 = add <2 x i32> %tmp5, %tmp6
				213	ret <2 x i32> %tmp7
				214	}
				215
				216	define <2 x float> @vld3lanef(float* %A, <2 x float>* %B) nounwind {
				217	;CHECK: vld3lanef:
				218	;CHECK: vld3.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	219	%tmp0 = bitcast float* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	220	%tmp1 = load <2 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	221	%tmp2 = call %struct.__neon_float32x2x3_t @llvm.arm.neon.vld3lane.v2f32(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	222	%tmp3 = extractvalue %struct.__neon_float32x2x3_t %tmp2, 0
				223	%tmp4 = extractvalue %struct.__neon_float32x2x3_t %tmp2, 1
				224	%tmp5 = extractvalue %struct.__neon_float32x2x3_t %tmp2, 2
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	225	%tmp6 = fadd <2 x float> %tmp3, %tmp4
				226	%tmp7 = fadd <2 x float> %tmp5, %tmp6
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	227	ret <2 x float> %tmp7
				228	}
				229
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	230	define <8 x i16> @vld3laneQi16(i16* %A, <8 x i16>* %B) nounwind {
				231	;CHECK: vld3laneQi16:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	232	;Check the (default) alignment value. VLD3 does not support alignment.
				233	;CHECK: vld3.16 {d16[1], d18[1], d20[1]}, [r0]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	234	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	235	%tmp1 = load <8 x i16>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	236	%tmp2 = call %struct.__neon_int16x8x3_t @llvm.arm.neon.vld3lane.v8i16(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 1, i32 8)
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	237	%tmp3 = extractvalue %struct.__neon_int16x8x3_t %tmp2, 0
				238	%tmp4 = extractvalue %struct.__neon_int16x8x3_t %tmp2, 1
				239	%tmp5 = extractvalue %struct.__neon_int16x8x3_t %tmp2, 2
				240	%tmp6 = add <8 x i16> %tmp3, %tmp4
				241	%tmp7 = add <8 x i16> %tmp5, %tmp6
				242	ret <8 x i16> %tmp7
				243	}
				244
				245	define <4 x i32> @vld3laneQi32(i32* %A, <4 x i32>* %B) nounwind {
				246	;CHECK: vld3laneQi32:
				247	;CHECK: vld3.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	248	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	249	%tmp1 = load <4 x i32>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	250	%tmp2 = call %struct.__neon_int32x4x3_t @llvm.arm.neon.vld3lane.v4i32(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 3, i32 1)
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	251	%tmp3 = extractvalue %struct.__neon_int32x4x3_t %tmp2, 0
				252	%tmp4 = extractvalue %struct.__neon_int32x4x3_t %tmp2, 1
				253	%tmp5 = extractvalue %struct.__neon_int32x4x3_t %tmp2, 2
				254	%tmp6 = add <4 x i32> %tmp3, %tmp4
				255	%tmp7 = add <4 x i32> %tmp5, %tmp6
				256	ret <4 x i32> %tmp7
				257	}
				258
				259	define <4 x float> @vld3laneQf(float* %A, <4 x float>* %B) nounwind {
				260	;CHECK: vld3laneQf:
				261	;CHECK: vld3.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	262	%tmp0 = bitcast float* %A to i8*
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	263	%tmp1 = load <4 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	264	%tmp2 = call %struct.__neon_float32x4x3_t @llvm.arm.neon.vld3lane.v4f32(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	265	%tmp3 = extractvalue %struct.__neon_float32x4x3_t %tmp2, 0
				266	%tmp4 = extractvalue %struct.__neon_float32x4x3_t %tmp2, 1
				267	%tmp5 = extractvalue %struct.__neon_float32x4x3_t %tmp2, 2
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	268	%tmp6 = fadd <4 x float> %tmp3, %tmp4
				269	%tmp7 = fadd <4 x float> %tmp5, %tmp6
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	270	ret <4 x float> %tmp7
				271	}
				272
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	273	declare %struct.__neon_int8x8x3_t @llvm.arm.neon.vld3lane.v8i8(i8*, <8 x i8>, <8 x i8>, <8 x i8>, i32, i32) nounwind readonly
				274	declare %struct.__neon_int16x4x3_t @llvm.arm.neon.vld3lane.v4i16(i8*, <4 x i16>, <4 x i16>, <4 x i16>, i32, i32) nounwind readonly
				275	declare %struct.__neon_int32x2x3_t @llvm.arm.neon.vld3lane.v2i32(i8*, <2 x i32>, <2 x i32>, <2 x i32>, i32, i32) nounwind readonly
				276	declare %struct.__neon_float32x2x3_t @llvm.arm.neon.vld3lane.v2f32(i8*, <2 x float>, <2 x float>, <2 x float>, i32, i32) nounwind readonly
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	277
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	278	declare %struct.__neon_int16x8x3_t @llvm.arm.neon.vld3lane.v8i16(i8*, <8 x i16>, <8 x i16>, <8 x i16>, i32, i32) nounwind readonly
				279	declare %struct.__neon_int32x4x3_t @llvm.arm.neon.vld3lane.v4i32(i8*, <4 x i32>, <4 x i32>, <4 x i32>, i32, i32) nounwind readonly
				280	declare %struct.__neon_float32x4x3_t @llvm.arm.neon.vld3lane.v4f32(i8*, <4 x float>, <4 x float>, <4 x float>, i32, i32) nounwind readonly
Bob Wilson	0bf7d99	2009-10-08 22:27:33 +0000	[diff] [blame]	281
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	282	%struct.__neon_int8x8x4_t = type { <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8> }
				283	%struct.__neon_int16x4x4_t = type { <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16> }
				284	%struct.__neon_int32x2x4_t = type { <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32> }
				285	%struct.__neon_float32x2x4_t = type { <2 x float>, <2 x float>, <2 x float>, <2 x float> }
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	286
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	287	%struct.__neon_int16x8x4_t = type { <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16> }
				288	%struct.__neon_int32x4x4_t = type { <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32> }
				289	%struct.__neon_float32x4x4_t = type { <4 x float>, <4 x float>, <4 x float>, <4 x float> }
				290
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	291	define <8 x i8> @vld4lanei8(i8* %A, <8 x i8>* %B) nounwind {
				292	;CHECK: vld4lanei8:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	293	;Check the alignment value. Max for this instruction is 32 bits:
				294	;CHECK: vld4.8 {d16[1], d17[1], d18[1], d19[1]}, [r0, :32]
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	295	%tmp1 = load <8 x i8>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	296	%tmp2 = call %struct.__neon_int8x8x4_t @llvm.arm.neon.vld4lane.v8i8(i8* %A, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, <8 x i8> %tmp1, i32 1, i32 8)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	297	%tmp3 = extractvalue %struct.__neon_int8x8x4_t %tmp2, 0
				298	%tmp4 = extractvalue %struct.__neon_int8x8x4_t %tmp2, 1
				299	%tmp5 = extractvalue %struct.__neon_int8x8x4_t %tmp2, 2
				300	%tmp6 = extractvalue %struct.__neon_int8x8x4_t %tmp2, 3
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	301	%tmp7 = add <8 x i8> %tmp3, %tmp4
				302	%tmp8 = add <8 x i8> %tmp5, %tmp6
				303	%tmp9 = add <8 x i8> %tmp7, %tmp8
				304	ret <8 x i8> %tmp9
				305	}
				306
				307	define <4 x i16> @vld4lanei16(i16* %A, <4 x i16>* %B) nounwind {
				308	;CHECK: vld4lanei16:
				309	;CHECK: vld4.16
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	310	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	311	%tmp1 = load <4 x i16>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	312	%tmp2 = call %struct.__neon_int16x4x4_t @llvm.arm.neon.vld4lane.v4i16(i8* %tmp0, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, <4 x i16> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	313	%tmp3 = extractvalue %struct.__neon_int16x4x4_t %tmp2, 0
				314	%tmp4 = extractvalue %struct.__neon_int16x4x4_t %tmp2, 1
				315	%tmp5 = extractvalue %struct.__neon_int16x4x4_t %tmp2, 2
				316	%tmp6 = extractvalue %struct.__neon_int16x4x4_t %tmp2, 3
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	317	%tmp7 = add <4 x i16> %tmp3, %tmp4
				318	%tmp8 = add <4 x i16> %tmp5, %tmp6
				319	%tmp9 = add <4 x i16> %tmp7, %tmp8
				320	ret <4 x i16> %tmp9
				321	}
				322
				323	define <2 x i32> @vld4lanei32(i32* %A, <2 x i32>* %B) nounwind {
				324	;CHECK: vld4lanei32:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	325	;Check the alignment value. Max for this instruction is 128 bits:
				326	;CHECK: vld4.32 {d16[1], d17[1], d18[1], d19[1]}, [r0, :128]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	327	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	328	%tmp1 = load <2 x i32>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	329	%tmp2 = call %struct.__neon_int32x2x4_t @llvm.arm.neon.vld4lane.v2i32(i8* %tmp0, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, <2 x i32> %tmp1, i32 1, i32 16)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	330	%tmp3 = extractvalue %struct.__neon_int32x2x4_t %tmp2, 0
				331	%tmp4 = extractvalue %struct.__neon_int32x2x4_t %tmp2, 1
				332	%tmp5 = extractvalue %struct.__neon_int32x2x4_t %tmp2, 2
				333	%tmp6 = extractvalue %struct.__neon_int32x2x4_t %tmp2, 3
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	334	%tmp7 = add <2 x i32> %tmp3, %tmp4
				335	%tmp8 = add <2 x i32> %tmp5, %tmp6
				336	%tmp9 = add <2 x i32> %tmp7, %tmp8
				337	ret <2 x i32> %tmp9
				338	}
				339
				340	define <2 x float> @vld4lanef(float* %A, <2 x float>* %B) nounwind {
				341	;CHECK: vld4lanef:
				342	;CHECK: vld4.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	343	%tmp0 = bitcast float* %A to i8*
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	344	%tmp1 = load <2 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	345	%tmp2 = call %struct.__neon_float32x2x4_t @llvm.arm.neon.vld4lane.v2f32(i8* %tmp0, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, <2 x float> %tmp1, i32 1, i32 1)
Bob Wilson	ec1d81c	2009-10-06 21:16:19 +0000	[diff] [blame]	346	%tmp3 = extractvalue %struct.__neon_float32x2x4_t %tmp2, 0
				347	%tmp4 = extractvalue %struct.__neon_float32x2x4_t %tmp2, 1
				348	%tmp5 = extractvalue %struct.__neon_float32x2x4_t %tmp2, 2
				349	%tmp6 = extractvalue %struct.__neon_float32x2x4_t %tmp2, 3
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	350	%tmp7 = fadd <2 x float> %tmp3, %tmp4
				351	%tmp8 = fadd <2 x float> %tmp5, %tmp6
				352	%tmp9 = fadd <2 x float> %tmp7, %tmp8
Bob Wilson	c011005	2009-09-01 04:27:10 +0000	[diff] [blame]	353	ret <2 x float> %tmp9
				354	}
				355
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	356	define <8 x i16> @vld4laneQi16(i16* %A, <8 x i16>* %B) nounwind {
				357	;CHECK: vld4laneQi16:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	358	;Check the alignment value. Max for this instruction is 64 bits:
				359	;CHECK: vld4.16 {d16[1], d18[1], d20[1], d22[1]}, [r0, :64]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	360	%tmp0 = bitcast i16* %A to i8*
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	361	%tmp1 = load <8 x i16>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	362	%tmp2 = call %struct.__neon_int16x8x4_t @llvm.arm.neon.vld4lane.v8i16(i8* %tmp0, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, <8 x i16> %tmp1, i32 1, i32 16)
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	363	%tmp3 = extractvalue %struct.__neon_int16x8x4_t %tmp2, 0
				364	%tmp4 = extractvalue %struct.__neon_int16x8x4_t %tmp2, 1
				365	%tmp5 = extractvalue %struct.__neon_int16x8x4_t %tmp2, 2
				366	%tmp6 = extractvalue %struct.__neon_int16x8x4_t %tmp2, 3
				367	%tmp7 = add <8 x i16> %tmp3, %tmp4
				368	%tmp8 = add <8 x i16> %tmp5, %tmp6
				369	%tmp9 = add <8 x i16> %tmp7, %tmp8
				370	ret <8 x i16> %tmp9
				371	}
				372
				373	define <4 x i32> @vld4laneQi32(i32* %A, <4 x i32>* %B) nounwind {
				374	;CHECK: vld4laneQi32:
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	375	;Check the (default) alignment.
				376	;CHECK: vld4.32 {d17[0], d19[0], d21[0], d23[0]}, [r0]
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	377	%tmp0 = bitcast i32* %A to i8*
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	378	%tmp1 = load <4 x i32>* %B
Bob Wilson	3454ed9	2010-10-19 00:16:32 +0000	[diff] [blame]	379	%tmp2 = call %struct.__neon_int32x4x4_t @llvm.arm.neon.vld4lane.v4i32(i8* %tmp0, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, <4 x i32> %tmp1, i32 2, i32 1)
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	380	%tmp3 = extractvalue %struct.__neon_int32x4x4_t %tmp2, 0
				381	%tmp4 = extractvalue %struct.__neon_int32x4x4_t %tmp2, 1
				382	%tmp5 = extractvalue %struct.__neon_int32x4x4_t %tmp2, 2
				383	%tmp6 = extractvalue %struct.__neon_int32x4x4_t %tmp2, 3
				384	%tmp7 = add <4 x i32> %tmp3, %tmp4
				385	%tmp8 = add <4 x i32> %tmp5, %tmp6
				386	%tmp9 = add <4 x i32> %tmp7, %tmp8
				387	ret <4 x i32> %tmp9
				388	}
				389
				390	define <4 x float> @vld4laneQf(float* %A, <4 x float>* %B) nounwind {
				391	;CHECK: vld4laneQf:
				392	;CHECK: vld4.32
Bob Wilson	02170c0	2010-04-20 00:17:16 +0000	[diff] [blame]	393	%tmp0 = bitcast float* %A to i8*
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	394	%tmp1 = load <4 x float>* %B
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	395	%tmp2 = call %struct.__neon_float32x4x4_t @llvm.arm.neon.vld4lane.v4f32(i8* %tmp0, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, <4 x float> %tmp1, i32 1, i32 1)
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	396	%tmp3 = extractvalue %struct.__neon_float32x4x4_t %tmp2, 0
				397	%tmp4 = extractvalue %struct.__neon_float32x4x4_t %tmp2, 1
				398	%tmp5 = extractvalue %struct.__neon_float32x4x4_t %tmp2, 2
				399	%tmp6 = extractvalue %struct.__neon_float32x4x4_t %tmp2, 3
Dan Gohman	d4d0115	2010-05-03 22:36:46 +0000	[diff] [blame]	400	%tmp7 = fadd <4 x float> %tmp3, %tmp4
				401	%tmp8 = fadd <4 x float> %tmp5, %tmp6
				402	%tmp9 = fadd <4 x float> %tmp7, %tmp8
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	403	ret <4 x float> %tmp9
				404	}
				405
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	406	declare %struct.__neon_int8x8x4_t @llvm.arm.neon.vld4lane.v8i8(i8*, <8 x i8>, <8 x i8>, <8 x i8>, <8 x i8>, i32, i32) nounwind readonly
				407	declare %struct.__neon_int16x4x4_t @llvm.arm.neon.vld4lane.v4i16(i8*, <4 x i16>, <4 x i16>, <4 x i16>, <4 x i16>, i32, i32) nounwind readonly
				408	declare %struct.__neon_int32x2x4_t @llvm.arm.neon.vld4lane.v2i32(i8*, <2 x i32>, <2 x i32>, <2 x i32>, <2 x i32>, i32, i32) nounwind readonly
				409	declare %struct.__neon_float32x2x4_t @llvm.arm.neon.vld4lane.v2f32(i8*, <2 x float>, <2 x float>, <2 x float>, <2 x float>, i32, i32) nounwind readonly
Bob Wilson	62e053e	2009-10-08 22:53:57 +0000	[diff] [blame]	410
Bob Wilson	7a9ef44	2010-08-27 17:13:24 +0000	[diff] [blame]	411	declare %struct.__neon_int16x8x4_t @llvm.arm.neon.vld4lane.v8i16(i8*, <8 x i16>, <8 x i16>, <8 x i16>, <8 x i16>, i32, i32) nounwind readonly
				412	declare %struct.__neon_int32x4x4_t @llvm.arm.neon.vld4lane.v4i32(i8*, <4 x i32>, <4 x i32>, <4 x i32>, <4 x i32>, i32, i32) nounwind readonly
				413	declare %struct.__neon_float32x4x4_t @llvm.arm.neon.vld4lane.v4f32(i8*, <4 x float>, <4 x float>, <4 x float>, <4 x float>, i32, i32) nounwind readonly