Blame - llvm/test/CodeGen/AArch64/load-combine-big-endian.ll - toolchain/llvm-project

blob: e60e86a4052ea11837fcebba9025c8d2c4cdc273 [file] [log] [blame]

Artur Pilipenko	41c0005	2017-01-25 08:53:31 +0000	[diff] [blame]	1	; RUN: llc < %s -mtriple=arm64eb-unknown \| FileCheck %s
				2
				3	; i8* p; // p is 4 byte aligned
				4	; ((i32) p[0] << 24) \| ((i32) p[1] << 16) \| ((i32) p[2] << 8) \| (i32) p[3]
				5	define i32 @load_i32_by_i8_big_endian(i32* %arg) {
				6	; CHECK-LABEL: load_i32_by_i8_big_endian:
				7	; CHECK: ldr w0, [x0]
				8	; CHECK-NEXT: ret
				9	%tmp = bitcast i32* %arg to i8*
				10	%tmp1 = load i8, i8* %tmp, align 4
				11	%tmp2 = zext i8 %tmp1 to i32
				12	%tmp3 = shl nuw nsw i32 %tmp2, 24
				13	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 1
				14	%tmp5 = load i8, i8* %tmp4, align 1
				15	%tmp6 = zext i8 %tmp5 to i32
				16	%tmp7 = shl nuw nsw i32 %tmp6, 16
				17	%tmp8 = or i32 %tmp7, %tmp3
				18	%tmp9 = getelementptr inbounds i8, i8* %tmp, i32 2
				19	%tmp10 = load i8, i8* %tmp9, align 1
				20	%tmp11 = zext i8 %tmp10 to i32
				21	%tmp12 = shl nuw nsw i32 %tmp11, 8
				22	%tmp13 = or i32 %tmp8, %tmp12
				23	%tmp14 = getelementptr inbounds i8, i8* %tmp, i32 3
				24	%tmp15 = load i8, i8* %tmp14, align 1
				25	%tmp16 = zext i8 %tmp15 to i32
				26	%tmp17 = or i32 %tmp13, %tmp16
				27	ret i32 %tmp17
				28	}
				29
				30	; i8* p; // p is 4 byte aligned
				31	; ((i32) (((i16) p[0] << 8) \| (i16) p[1]) << 16) \| (i32) (((i16) p[3] << 8) \| (i16) p[4])
				32	define i32 @load_i32_by_i16_by_i8_big_endian(i32* %arg) {
				33	; CHECK-LABEL: load_i32_by_i16_by_i8_big_endian:
				34	; CHECK: ldr w0, [x0]
				35	; CHECK-NEXT: ret
				36	%tmp = bitcast i32* %arg to i8*
				37	%tmp1 = load i8, i8* %tmp, align 4
				38	%tmp2 = zext i8 %tmp1 to i16
				39	%tmp3 = getelementptr inbounds i8, i8* %tmp, i32 1
				40	%tmp4 = load i8, i8* %tmp3, align 1
				41	%tmp5 = zext i8 %tmp4 to i16
				42	%tmp6 = shl nuw nsw i16 %tmp2, 8
				43	%tmp7 = or i16 %tmp6, %tmp5
				44	%tmp8 = getelementptr inbounds i8, i8* %tmp, i32 2
				45	%tmp9 = load i8, i8* %tmp8, align 1
				46	%tmp10 = zext i8 %tmp9 to i16
				47	%tmp11 = getelementptr inbounds i8, i8* %tmp, i32 3
				48	%tmp12 = load i8, i8* %tmp11, align 1
				49	%tmp13 = zext i8 %tmp12 to i16
				50	%tmp14 = shl nuw nsw i16 %tmp10, 8
				51	%tmp15 = or i16 %tmp14, %tmp13
				52	%tmp16 = zext i16 %tmp7 to i32
				53	%tmp17 = zext i16 %tmp15 to i32
				54	%tmp18 = shl nuw nsw i32 %tmp16, 16
				55	%tmp19 = or i32 %tmp18, %tmp17
				56	ret i32 %tmp19
				57	}
				58
				59	; i16* p; // p is 4 byte aligned
				60	; ((i32) p[0] << 16) \| (i32) p[1]
				61	define i32 @load_i32_by_i16(i32* %arg) {
				62	; CHECK-LABEL: load_i32_by_i16:
				63	; CHECK: ldr w0, [x0]
				64	; CHECK-NEXT: ret
				65	%tmp = bitcast i32* %arg to i16*
				66	%tmp1 = load i16, i16* %tmp, align 4
				67	%tmp2 = zext i16 %tmp1 to i32
				68	%tmp3 = getelementptr inbounds i16, i16* %tmp, i32 1
				69	%tmp4 = load i16, i16* %tmp3, align 1
				70	%tmp5 = zext i16 %tmp4 to i32
				71	%tmp6 = shl nuw nsw i32 %tmp2, 16
				72	%tmp7 = or i32 %tmp6, %tmp5
				73	ret i32 %tmp7
				74	}
				75
				76	; i16* p_16; // p_16 is 4 byte aligned
				77	; i8* p_8 = (i8*) p_16;
				78	; (i32) (p_16[0] << 16) \| ((i32) p[2] << 8) \| (i32) p[3]
				79	define i32 @load_i32_by_i16_i8(i32* %arg) {
				80	; CHECK-LABEL: load_i32_by_i16_i8:
				81	; CHECK: ldr w0, [x0]
				82	; CHECK-NEXT: ret
				83	%tmp = bitcast i32* %arg to i16*
				84	%tmp1 = bitcast i32* %arg to i8*
				85	%tmp2 = load i16, i16* %tmp, align 4
				86	%tmp3 = zext i16 %tmp2 to i32
				87	%tmp4 = shl nuw nsw i32 %tmp3, 16
				88	%tmp5 = getelementptr inbounds i8, i8* %tmp1, i32 2
				89	%tmp6 = load i8, i8* %tmp5, align 1
				90	%tmp7 = zext i8 %tmp6 to i32
				91	%tmp8 = shl nuw nsw i32 %tmp7, 8
				92	%tmp9 = getelementptr inbounds i8, i8* %tmp1, i32 3
				93	%tmp10 = load i8, i8* %tmp9, align 1
				94	%tmp11 = zext i8 %tmp10 to i32
				95	%tmp12 = or i32 %tmp8, %tmp11
				96	%tmp13 = or i32 %tmp12, %tmp4
				97	ret i32 %tmp13
				98	}
				99
				100	; i8* p; // p is 8 byte aligned
				101	; (i64) p[0] \| ((i64) p[1] << 8) \| ((i64) p[2] << 16) \| ((i64) p[3] << 24) \| ((i64) p[4] << 32) \| ((i64) p[5] << 40) \| ((i64) p[6] << 48) \| ((i64) p[7] << 56)
				102	define i64 @load_i64_by_i8_bswap(i64* %arg) {
				103	; CHECK-LABEL: load_i64_by_i8_bswap:
				104	; CHECK: ldr x8, [x0]
				105	; CHECK-NEXT: rev x0, x8
				106	; CHECK-NEXT: ret
				107	%tmp = bitcast i64* %arg to i8*
				108	%tmp1 = load i8, i8* %tmp, align 8
				109	%tmp2 = zext i8 %tmp1 to i64
				110	%tmp3 = getelementptr inbounds i8, i8* %tmp, i64 1
				111	%tmp4 = load i8, i8* %tmp3, align 1
				112	%tmp5 = zext i8 %tmp4 to i64
				113	%tmp6 = shl nuw nsw i64 %tmp5, 8
				114	%tmp7 = or i64 %tmp6, %tmp2
				115	%tmp8 = getelementptr inbounds i8, i8* %tmp, i64 2
				116	%tmp9 = load i8, i8* %tmp8, align 1
				117	%tmp10 = zext i8 %tmp9 to i64
				118	%tmp11 = shl nuw nsw i64 %tmp10, 16
				119	%tmp12 = or i64 %tmp7, %tmp11
				120	%tmp13 = getelementptr inbounds i8, i8* %tmp, i64 3
				121	%tmp14 = load i8, i8* %tmp13, align 1
				122	%tmp15 = zext i8 %tmp14 to i64
				123	%tmp16 = shl nuw nsw i64 %tmp15, 24
				124	%tmp17 = or i64 %tmp12, %tmp16
				125	%tmp18 = getelementptr inbounds i8, i8* %tmp, i64 4
				126	%tmp19 = load i8, i8* %tmp18, align 1
				127	%tmp20 = zext i8 %tmp19 to i64
				128	%tmp21 = shl nuw nsw i64 %tmp20, 32
				129	%tmp22 = or i64 %tmp17, %tmp21
				130	%tmp23 = getelementptr inbounds i8, i8* %tmp, i64 5
				131	%tmp24 = load i8, i8* %tmp23, align 1
				132	%tmp25 = zext i8 %tmp24 to i64
				133	%tmp26 = shl nuw nsw i64 %tmp25, 40
				134	%tmp27 = or i64 %tmp22, %tmp26
				135	%tmp28 = getelementptr inbounds i8, i8* %tmp, i64 6
				136	%tmp29 = load i8, i8* %tmp28, align 1
				137	%tmp30 = zext i8 %tmp29 to i64
				138	%tmp31 = shl nuw nsw i64 %tmp30, 48
				139	%tmp32 = or i64 %tmp27, %tmp31
				140	%tmp33 = getelementptr inbounds i8, i8* %tmp, i64 7
				141	%tmp34 = load i8, i8* %tmp33, align 1
				142	%tmp35 = zext i8 %tmp34 to i64
				143	%tmp36 = shl nuw i64 %tmp35, 56
				144	%tmp37 = or i64 %tmp32, %tmp36
				145	ret i64 %tmp37
				146	}
				147
				148	; i8* p; // p is 8 byte aligned
				149	; ((i64) p[0] << 56) \| ((i64) p[1] << 48) \| ((i64) p[2] << 40) \| ((i64) p[3] << 32) \| ((i64) p[4] << 24) \| ((i64) p[5] << 16) \| ((i64) p[6] << 8) \| (i64) p[7]
				150	define i64 @load_i64_by_i8(i64* %arg) {
				151	; CHECK-LABEL: load_i64_by_i8:
				152	; CHECK: ldr x0, [x0]
				153	; CHECK-NEXT: ret
				154	%tmp = bitcast i64* %arg to i8*
				155	%tmp1 = load i8, i8* %tmp, align 8
				156	%tmp2 = zext i8 %tmp1 to i64
				157	%tmp3 = shl nuw i64 %tmp2, 56
				158	%tmp4 = getelementptr inbounds i8, i8* %tmp, i64 1
				159	%tmp5 = load i8, i8* %tmp4, align 1
				160	%tmp6 = zext i8 %tmp5 to i64
				161	%tmp7 = shl nuw nsw i64 %tmp6, 48
				162	%tmp8 = or i64 %tmp7, %tmp3
				163	%tmp9 = getelementptr inbounds i8, i8* %tmp, i64 2
				164	%tmp10 = load i8, i8* %tmp9, align 1
				165	%tmp11 = zext i8 %tmp10 to i64
				166	%tmp12 = shl nuw nsw i64 %tmp11, 40
				167	%tmp13 = or i64 %tmp8, %tmp12
				168	%tmp14 = getelementptr inbounds i8, i8* %tmp, i64 3
				169	%tmp15 = load i8, i8* %tmp14, align 1
				170	%tmp16 = zext i8 %tmp15 to i64
				171	%tmp17 = shl nuw nsw i64 %tmp16, 32
				172	%tmp18 = or i64 %tmp13, %tmp17
				173	%tmp19 = getelementptr inbounds i8, i8* %tmp, i64 4
				174	%tmp20 = load i8, i8* %tmp19, align 1
				175	%tmp21 = zext i8 %tmp20 to i64
				176	%tmp22 = shl nuw nsw i64 %tmp21, 24
				177	%tmp23 = or i64 %tmp18, %tmp22
				178	%tmp24 = getelementptr inbounds i8, i8* %tmp, i64 5
				179	%tmp25 = load i8, i8* %tmp24, align 1
				180	%tmp26 = zext i8 %tmp25 to i64
				181	%tmp27 = shl nuw nsw i64 %tmp26, 16
				182	%tmp28 = or i64 %tmp23, %tmp27
				183	%tmp29 = getelementptr inbounds i8, i8* %tmp, i64 6
				184	%tmp30 = load i8, i8* %tmp29, align 1
				185	%tmp31 = zext i8 %tmp30 to i64
				186	%tmp32 = shl nuw nsw i64 %tmp31, 8
				187	%tmp33 = or i64 %tmp28, %tmp32
				188	%tmp34 = getelementptr inbounds i8, i8* %tmp, i64 7
				189	%tmp35 = load i8, i8* %tmp34, align 1
				190	%tmp36 = zext i8 %tmp35 to i64
				191	%tmp37 = or i64 %tmp33, %tmp36
				192	ret i64 %tmp37
				193	}
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	194
				195	; i8* p; // p[1] is 4 byte aligned
				196	; (i32) p[1] \| ((i32) p[2] << 8) \| ((i32) p[3] << 16) \| ((i32) p[4] << 24)
				197	define i32 @load_i32_by_i8_nonzero_offset(i32* %arg) {
				198	; CHECK-LABEL: load_i32_by_i8_nonzero_offset:
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	199	; CHECK: ldur w8, [x0, #1]
				200	; CHECK-NEXT: rev w0, w8
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	201	; CHECK-NEXT: ret
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	202
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	203	%tmp = bitcast i32* %arg to i8*
				204	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 1
				205	%tmp2 = load i8, i8* %tmp1, align 4
				206	%tmp3 = zext i8 %tmp2 to i32
				207	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 2
				208	%tmp5 = load i8, i8* %tmp4, align 1
				209	%tmp6 = zext i8 %tmp5 to i32
				210	%tmp7 = shl nuw nsw i32 %tmp6, 8
				211	%tmp8 = or i32 %tmp7, %tmp3
				212	%tmp9 = getelementptr inbounds i8, i8* %tmp, i32 3
				213	%tmp10 = load i8, i8* %tmp9, align 1
				214	%tmp11 = zext i8 %tmp10 to i32
				215	%tmp12 = shl nuw nsw i32 %tmp11, 16
				216	%tmp13 = or i32 %tmp8, %tmp12
				217	%tmp14 = getelementptr inbounds i8, i8* %tmp, i32 4
				218	%tmp15 = load i8, i8* %tmp14, align 1
				219	%tmp16 = zext i8 %tmp15 to i32
				220	%tmp17 = shl nuw nsw i32 %tmp16, 24
				221	%tmp18 = or i32 %tmp13, %tmp17
				222	ret i32 %tmp18
				223	}
				224
				225	; i8* p; // p[-4] is 4 byte aligned
				226	; (i32) p[-4] \| ((i32) p[-3] << 8) \| ((i32) p[-2] << 16) \| ((i32) p[-1] << 24)
				227	define i32 @load_i32_by_i8_neg_offset(i32* %arg) {
				228	; CHECK-LABEL: load_i32_by_i8_neg_offset:
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	229	; CHECK: ldur w8, [x0, #-4]
				230	; CHECK-NEXT: rev w0, w8
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	231	; CHECK-NEXT: ret
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	232
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	233	%tmp = bitcast i32* %arg to i8*
				234	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 -4
				235	%tmp2 = load i8, i8* %tmp1, align 4
				236	%tmp3 = zext i8 %tmp2 to i32
				237	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 -3
				238	%tmp5 = load i8, i8* %tmp4, align 1
				239	%tmp6 = zext i8 %tmp5 to i32
				240	%tmp7 = shl nuw nsw i32 %tmp6, 8
				241	%tmp8 = or i32 %tmp7, %tmp3
				242	%tmp9 = getelementptr inbounds i8, i8* %tmp, i32 -2
				243	%tmp10 = load i8, i8* %tmp9, align 1
				244	%tmp11 = zext i8 %tmp10 to i32
				245	%tmp12 = shl nuw nsw i32 %tmp11, 16
				246	%tmp13 = or i32 %tmp8, %tmp12
				247	%tmp14 = getelementptr inbounds i8, i8* %tmp, i32 -1
				248	%tmp15 = load i8, i8* %tmp14, align 1
				249	%tmp16 = zext i8 %tmp15 to i32
				250	%tmp17 = shl nuw nsw i32 %tmp16, 24
				251	%tmp18 = or i32 %tmp13, %tmp17
				252	ret i32 %tmp18
				253	}
				254
				255	; i8* p; // p[1] is 4 byte aligned
				256	; (i32) p[4] \| ((i32) p[3] << 8) \| ((i32) p[2] << 16) \| ((i32) p[1] << 24)
				257	define i32 @load_i32_by_i8_nonzero_offset_bswap(i32* %arg) {
				258	; CHECK-LABEL: load_i32_by_i8_nonzero_offset_bswap:
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	259	; CHECK: ldur w0, [x0, #1]
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	260	; CHECK-NEXT: ret
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	261
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	262	%tmp = bitcast i32* %arg to i8*
				263	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 4
				264	%tmp2 = load i8, i8* %tmp1, align 1
				265	%tmp3 = zext i8 %tmp2 to i32
				266	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 3
				267	%tmp5 = load i8, i8* %tmp4, align 1
				268	%tmp6 = zext i8 %tmp5 to i32
				269	%tmp7 = shl nuw nsw i32 %tmp6, 8
				270	%tmp8 = or i32 %tmp7, %tmp3
				271	%tmp9 = getelementptr inbounds i8, i8* %tmp, i32 2
				272	%tmp10 = load i8, i8* %tmp9, align 1
				273	%tmp11 = zext i8 %tmp10 to i32
				274	%tmp12 = shl nuw nsw i32 %tmp11, 16
				275	%tmp13 = or i32 %tmp8, %tmp12
				276	%tmp14 = getelementptr inbounds i8, i8* %tmp, i32 1
				277	%tmp15 = load i8, i8* %tmp14, align 4
				278	%tmp16 = zext i8 %tmp15 to i32
				279	%tmp17 = shl nuw nsw i32 %tmp16, 24
				280	%tmp18 = or i32 %tmp13, %tmp17
				281	ret i32 %tmp18
				282	}
				283
				284	; i8* p; // p[-4] is 4 byte aligned
				285	; (i32) p[-1] \| ((i32) p[-2] << 8) \| ((i32) p[-3] << 16) \| ((i32) p[-4] << 24)
				286	define i32 @load_i32_by_i8_neg_offset_bswap(i32* %arg) {
				287	; CHECK-LABEL: load_i32_by_i8_neg_offset_bswap:
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	288	; CHECK: ldur w0, [x0, #-4]
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	289	; CHECK-NEXT: ret
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	290
Artur Pilipenko	bdf3c5a	2017-02-06 14:15:31 +0000	[diff] [blame]	291	%tmp = bitcast i32* %arg to i8*
				292	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 -1
				293	%tmp2 = load i8, i8* %tmp1, align 1
				294	%tmp3 = zext i8 %tmp2 to i32
				295	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 -2
				296	%tmp5 = load i8, i8* %tmp4, align 1
				297	%tmp6 = zext i8 %tmp5 to i32
				298	%tmp7 = shl nuw nsw i32 %tmp6, 8
				299	%tmp8 = or i32 %tmp7, %tmp3
				300	%tmp9 = getelementptr inbounds i8, i8* %tmp, i32 -3
				301	%tmp10 = load i8, i8* %tmp9, align 1
				302	%tmp11 = zext i8 %tmp10 to i32
				303	%tmp12 = shl nuw nsw i32 %tmp11, 16
				304	%tmp13 = or i32 %tmp8, %tmp12
				305	%tmp14 = getelementptr inbounds i8, i8* %tmp, i32 -4
				306	%tmp15 = load i8, i8* %tmp14, align 4
				307	%tmp16 = zext i8 %tmp15 to i32
				308	%tmp17 = shl nuw nsw i32 %tmp16, 24
				309	%tmp18 = or i32 %tmp13, %tmp17
				310	ret i32 %tmp18
				311	}
Artur Pilipenko	d3464bf	2017-02-06 17:48:08 +0000	[diff] [blame]	312
				313	declare i16 @llvm.bswap.i16(i16)
				314
				315	; i16* p; // p is 4 byte aligned
				316	; (i32) bswap(p[0]) \| (i32) bswap(p[1] << 16)
				317	define i32 @load_i32_by_bswap_i16(i32* %arg) {
				318	; CHECK-LABEL: load_i32_by_bswap_i16:
				319	; CHECK: ldr w8, [x0]
				320	; CHECK-NEXT: rev w0, w8
				321	; CHECK-NEXT: ret
				322	%tmp = bitcast i32* %arg to i16*
				323	%tmp1 = load i16, i16* %tmp, align 4
				324	%tmp11 = call i16 @llvm.bswap.i16(i16 %tmp1)
				325	%tmp2 = zext i16 %tmp11 to i32
				326	%tmp3 = getelementptr inbounds i16, i16* %tmp, i32 1
				327	%tmp4 = load i16, i16* %tmp3, align 1
				328	%tmp41 = call i16 @llvm.bswap.i16(i16 %tmp4)
				329	%tmp5 = zext i16 %tmp41 to i32
				330	%tmp6 = shl nuw nsw i32 %tmp5, 16
				331	%tmp7 = or i32 %tmp6, %tmp2
				332	ret i32 %tmp7
				333	}
Artur Pilipenko	469596e	2017-02-07 14:09:37 +0000	[diff] [blame]	334
				335	; i16* p; // p is 4 byte aligned
				336	; (i32) p[1] \| (sext(p[0] << 16) to i32)
				337	define i32 @load_i32_by_sext_i16(i32* %arg) {
				338	; CHECK-LABEL: load_i32_by_sext_i16:
Bill Seurer	8e48f41	2017-02-22 16:27:33 +0000	[diff] [blame]	339	; CHECK: ldrh w8, [x0]
				340	; CHECK-NEXT: ldrh w0, [x0, #2]
				341	; CHECK-NEXT: bfi w0, w8, #16, #16
Artur Pilipenko	469596e	2017-02-07 14:09:37 +0000	[diff] [blame]	342	; CHECK-NEXT: ret
Bill Seurer	8e48f41	2017-02-22 16:27:33 +0000	[diff] [blame]	343
Artur Pilipenko	469596e	2017-02-07 14:09:37 +0000	[diff] [blame]	344	%tmp = bitcast i32* %arg to i16*
				345	%tmp1 = load i16, i16* %tmp, align 4
				346	%tmp2 = sext i16 %tmp1 to i32
				347	%tmp3 = getelementptr inbounds i16, i16* %tmp, i32 1
				348	%tmp4 = load i16, i16* %tmp3, align 1
				349	%tmp5 = zext i16 %tmp4 to i32
				350	%tmp6 = shl nuw nsw i32 %tmp2, 16
				351	%tmp7 = or i32 %tmp6, %tmp5
				352	ret i32 %tmp7
				353	}
				354
				355	; i8* arg; i32 i;
				356	; p = arg + 12;
				357	; (i32) p[i] \| ((i32) p[i + 1] << 8) \| ((i32) p[i + 2] << 16) \| ((i32) p[i + 3] << 24)
				358	define i32 @load_i32_by_i8_base_offset_index(i8* %arg, i32 %i) {
				359	; CHECK-LABEL: load_i32_by_i8_base_offset_index:
				360	; CHECK: add x8, x0, w1, uxtw
				361	; CHECK-NEXT: ldr w8, [x8, #12]
				362	; CHECK-NEXT: rev w0, w8
				363	; CHECK-NEXT: ret
				364	%tmp = add nuw nsw i32 %i, 3
				365	%tmp2 = add nuw nsw i32 %i, 2
				366	%tmp3 = add nuw nsw i32 %i, 1
				367	%tmp4 = getelementptr inbounds i8, i8* %arg, i64 12
				368	%tmp5 = zext i32 %i to i64
				369	%tmp6 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp5
				370	%tmp7 = load i8, i8* %tmp6, align 4
				371	%tmp8 = zext i8 %tmp7 to i32
				372	%tmp9 = zext i32 %tmp3 to i64
				373	%tmp10 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp9
				374	%tmp11 = load i8, i8* %tmp10, align 1
				375	%tmp12 = zext i8 %tmp11 to i32
				376	%tmp13 = shl nuw nsw i32 %tmp12, 8
				377	%tmp14 = or i32 %tmp13, %tmp8
				378	%tmp15 = zext i32 %tmp2 to i64
				379	%tmp16 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp15
				380	%tmp17 = load i8, i8* %tmp16, align 1
				381	%tmp18 = zext i8 %tmp17 to i32
				382	%tmp19 = shl nuw nsw i32 %tmp18, 16
				383	%tmp20 = or i32 %tmp14, %tmp19
				384	%tmp21 = zext i32 %tmp to i64
				385	%tmp22 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp21
				386	%tmp23 = load i8, i8* %tmp22, align 1
				387	%tmp24 = zext i8 %tmp23 to i32
				388	%tmp25 = shl nuw i32 %tmp24, 24
				389	%tmp26 = or i32 %tmp20, %tmp25
				390	ret i32 %tmp26
				391	}
				392
				393	; i8* arg; i32 i;
				394	; p = arg + 12;
				395	; (i32) p[i + 1] \| ((i32) p[i + 2] << 8) \| ((i32) p[i + 3] << 16) \| ((i32) p[i + 4] << 24)
				396	define i32 @load_i32_by_i8_base_offset_index_2(i8* %arg, i32 %i) {
				397	; CHECK-LABEL: load_i32_by_i8_base_offset_index_2:
				398	; CHECK: add x8, x0, w1, uxtw
Artur Pilipenko	4a64031	2017-02-09 12:06:01 +0000	[diff] [blame]	399	; CHECK-NEXT: ldur w8, [x8, #13]
				400	; CHECK-NEXT: rev w0, w8
Artur Pilipenko	469596e	2017-02-07 14:09:37 +0000	[diff] [blame]	401	; CHECK-NEXT: ret
Bill Seurer	8e48f41	2017-02-22 16:27:33 +0000	[diff] [blame]	402
Artur Pilipenko	469596e	2017-02-07 14:09:37 +0000	[diff] [blame]	403	%tmp = add nuw nsw i32 %i, 4
				404	%tmp2 = add nuw nsw i32 %i, 3
				405	%tmp3 = add nuw nsw i32 %i, 2
				406	%tmp4 = getelementptr inbounds i8, i8* %arg, i64 12
				407	%tmp5 = add nuw nsw i32 %i, 1
				408	%tmp27 = zext i32 %tmp5 to i64
				409	%tmp28 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp27
				410	%tmp29 = load i8, i8* %tmp28, align 4
				411	%tmp30 = zext i8 %tmp29 to i32
				412	%tmp31 = zext i32 %tmp3 to i64
				413	%tmp32 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp31
				414	%tmp33 = load i8, i8* %tmp32, align 1
				415	%tmp34 = zext i8 %tmp33 to i32
				416	%tmp35 = shl nuw nsw i32 %tmp34, 8
				417	%tmp36 = or i32 %tmp35, %tmp30
				418	%tmp37 = zext i32 %tmp2 to i64
				419	%tmp38 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp37
				420	%tmp39 = load i8, i8* %tmp38, align 1
				421	%tmp40 = zext i8 %tmp39 to i32
				422	%tmp41 = shl nuw nsw i32 %tmp40, 16
				423	%tmp42 = or i32 %tmp36, %tmp41
				424	%tmp43 = zext i32 %tmp to i64
				425	%tmp44 = getelementptr inbounds i8, i8* %tmp4, i64 %tmp43
				426	%tmp45 = load i8, i8* %tmp44, align 1
				427	%tmp46 = zext i8 %tmp45 to i32
				428	%tmp47 = shl nuw i32 %tmp46, 24
				429	%tmp48 = or i32 %tmp42, %tmp47
				430	ret i32 %tmp48
				431	}
Artur Pilipenko	0e4583b	2017-02-09 15:13:40 +0000	[diff] [blame]	432	; i8* p; // p is 2 byte aligned
				433	; (i32) p[0] \| ((i32) p[1] << 8)
				434	define i32 @zext_load_i32_by_i8(i32* %arg) {
				435	; CHECK-LABEL: zext_load_i32_by_i8:
				436	; CHECK: ldrb w8, [x0]
				437	; CHECK-NEXT: ldrb w9, [x0, #1]
				438	; CHECK-NEXT: bfi w8, w9, #8, #8
				439	; CHECK-NEXT: mov w0, w8
				440	; CHECK-NEXT: ret
				441
				442	%tmp = bitcast i32* %arg to i8*
				443	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 0
				444	%tmp2 = load i8, i8* %tmp1, align 2
				445	%tmp3 = zext i8 %tmp2 to i32
				446	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 1
				447	%tmp5 = load i8, i8* %tmp4, align 1
				448	%tmp6 = zext i8 %tmp5 to i32
				449	%tmp7 = shl nuw nsw i32 %tmp6, 8
				450	%tmp8 = or i32 %tmp7, %tmp3
				451	ret i32 %tmp8
				452	}
				453
				454	; i8* p; // p is 2 byte aligned
				455	; ((i32) p[0] << 8) \| ((i32) p[1] << 16)
				456	define i32 @zext_load_i32_by_i8_shl_8(i32* %arg) {
				457	; CHECK-LABEL: zext_load_i32_by_i8_shl_8:
				458	; CHECK: ldrb w8, [x0]
				459	; CHECK-NEXT: ldrb w9, [x0, #1]
				460	; CHECK-NEXT: lsl w0, w8, #8
				461	; CHECK-NEXT: bfi w0, w9, #16, #8
				462	; CHECK-NEXT: ret
				463
				464	%tmp = bitcast i32* %arg to i8*
				465	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 0
				466	%tmp2 = load i8, i8* %tmp1, align 2
				467	%tmp3 = zext i8 %tmp2 to i32
				468	%tmp30 = shl nuw nsw i32 %tmp3, 8
				469	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 1
				470	%tmp5 = load i8, i8* %tmp4, align 1
				471	%tmp6 = zext i8 %tmp5 to i32
				472	%tmp7 = shl nuw nsw i32 %tmp6, 16
				473	%tmp8 = or i32 %tmp7, %tmp30
				474	ret i32 %tmp8
				475	}
				476
				477	; i8* p; // p is 2 byte aligned
				478	; ((i32) p[0] << 16) \| ((i32) p[1] << 24)
				479	define i32 @zext_load_i32_by_i8_shl_16(i32* %arg) {
				480	; CHECK-LABEL: zext_load_i32_by_i8_shl_16:
				481	; CHECK: ldrb w8, [x0]
				482	; CHECK-NEXT: ldrb w9, [x0, #1]
				483	; CHECK-NEXT: lsl w0, w8, #16
				484	; CHECK-NEXT: bfi w0, w9, #24, #8
				485	; CHECK-NEXT: ret
				486
				487	%tmp = bitcast i32* %arg to i8*
				488	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 0
				489	%tmp2 = load i8, i8* %tmp1, align 2
				490	%tmp3 = zext i8 %tmp2 to i32
				491	%tmp30 = shl nuw nsw i32 %tmp3, 16
				492	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 1
				493	%tmp5 = load i8, i8* %tmp4, align 1
				494	%tmp6 = zext i8 %tmp5 to i32
				495	%tmp7 = shl nuw nsw i32 %tmp6, 24
				496	%tmp8 = or i32 %tmp7, %tmp30
				497	ret i32 %tmp8
				498	}
				499	; i8* p; // p is 2 byte aligned
				500	; (i32) p[1] \| ((i32) p[0] << 8)
				501	define i32 @zext_load_i32_by_i8_bswap(i32* %arg) {
				502	; CHECK-LABEL: zext_load_i32_by_i8_bswap:
				503	; CHECK: ldrb w8, [x0, #1]
				504	; CHECK-NEXT: ldrb w9, [x0]
				505	; CHECK-NEXT: bfi w8, w9, #8, #8
				506	; CHECK-NEXT: mov w0, w8
				507	; CHECK-NEXT: ret
				508
				509	%tmp = bitcast i32* %arg to i8*
				510	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 1
				511	%tmp2 = load i8, i8* %tmp1, align 1
				512	%tmp3 = zext i8 %tmp2 to i32
				513	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 0
				514	%tmp5 = load i8, i8* %tmp4, align 2
				515	%tmp6 = zext i8 %tmp5 to i32
				516	%tmp7 = shl nuw nsw i32 %tmp6, 8
				517	%tmp8 = or i32 %tmp7, %tmp3
				518	ret i32 %tmp8
				519	}
				520
				521	; i8* p; // p is 2 byte aligned
				522	; ((i32) p[1] << 8) \| ((i32) p[0] << 16)
				523	define i32 @zext_load_i32_by_i8_bswap_shl_8(i32* %arg) {
				524	; CHECK-LABEL: zext_load_i32_by_i8_bswap_shl_8:
				525	; CHECK: ldrb w8, [x0, #1]
				526	; CHECK-NEXT: ldrb w9, [x0]
				527	; CHECK-NEXT: lsl w0, w8, #8
				528	; CHECK-NEXT: bfi w0, w9, #16, #8
				529	; CHECK-NEXT: ret
				530
				531	%tmp = bitcast i32* %arg to i8*
				532	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 1
				533	%tmp2 = load i8, i8* %tmp1, align 1
				534	%tmp3 = zext i8 %tmp2 to i32
				535	%tmp30 = shl nuw nsw i32 %tmp3, 8
				536	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 0
				537	%tmp5 = load i8, i8* %tmp4, align 2
				538	%tmp6 = zext i8 %tmp5 to i32
				539	%tmp7 = shl nuw nsw i32 %tmp6, 16
				540	%tmp8 = or i32 %tmp7, %tmp30
				541	ret i32 %tmp8
				542	}
				543
				544	; i8* p; // p is 2 byte aligned
				545	; ((i32) p[1] << 16) \| ((i32) p[0] << 24)
				546	define i32 @zext_load_i32_by_i8_bswap_shl_16(i32* %arg) {
				547	; CHECK-LABEL: zext_load_i32_by_i8_bswap_shl_16:
				548	; CHECK: ldrb w8, [x0, #1]
				549	; CHECK-NEXT: ldrb w9, [x0]
				550	; CHECK-NEXT: lsl w0, w8, #16
				551	; CHECK-NEXT: bfi w0, w9, #24, #8
				552	; CHECK-NEXT: ret
				553
				554	%tmp = bitcast i32* %arg to i8*
				555	%tmp1 = getelementptr inbounds i8, i8* %tmp, i32 1
				556	%tmp2 = load i8, i8* %tmp1, align 1
				557	%tmp3 = zext i8 %tmp2 to i32
				558	%tmp30 = shl nuw nsw i32 %tmp3, 16
				559	%tmp4 = getelementptr inbounds i8, i8* %tmp, i32 0
				560	%tmp5 = load i8, i8* %tmp4, align 2
				561	%tmp6 = zext i8 %tmp5 to i32
				562	%tmp7 = shl nuw nsw i32 %tmp6, 24
				563	%tmp8 = or i32 %tmp7, %tmp30
				564	ret i32 %tmp8
				565	}
Artur Pilipenko	f7196c8	2017-02-27 13:04:23 +0000	[diff] [blame^]	566
				567	; i8* p;
				568	; i16* p1.i16 = (i16*) p;
				569	; (p1.i16[0] << 8) \| ((i16) p[2])
				570	;
				571	; This is essentialy a i16 load from p[1], but we don't fold the pattern now
				572	; because in the original DAG we don't have p[1] address available
				573	define i16 @load_i16_from_nonzero_offset(i8* %p) {
				574	; CHECK-LABEL: load_i16_from_nonzero_offset:
				575	; CHECK: ldrh w8, [x0]
				576	; CHECK-NEXT: ldrb w0, [x0, #2]
				577	; CHECK-NEXT: bfi w0, w8, #8, #24
				578	; CHECK-NEXT: ret
				579
				580	%p1.i16 = bitcast i8* %p to i16*
				581	%p2.i8 = getelementptr i8, i8* %p, i64 2
				582	%v1 = load i16, i16* %p1.i16
				583	%v2.i8 = load i8, i8* %p2.i8
				584	%v2 = zext i8 %v2.i8 to i16
				585	%v1.shl = shl i16 %v1, 8
				586	%res = or i16 %v1.shl, %v2
				587	ret i16 %res
				588	}