c4fcbed6b2b2d1e2253e325b292931cb3d05d3fe - platform/external/skia

commit	c4fcbed6b2b2d1e2253e325b292931cb3d05d3fe	[log] [tgz]
author	Mike Klein <mtklein@chromium.org>	Mon Jun 26 16:12:48 2017 -0400
committer	Skia Commit-Bot <skia-commit-bot@chromium.org>	Mon Jun 26 20:51:52 2017 +0000
tree	2fca874afd369944d62f7d704b8a8459c70f3866
parent	660cc9910f636b6092f5f2ee36567999f83fb648 [diff]

somewhat less silly tail loads and stores

No reason to keep going one at a time when we know there are generally
better ways to handle loading a power-of-two number of low lanes.

This strategy scales up too, with quick answers for 8 (one 8 byte load),
12 (one 8 byte, one 4 byte), etc.

$ ninja -C out monobench; and out/monobench SkRasterPipeline_compile 300

    Before: 46.946ns
    After:  43.341ns

(This happens to be _lowp.  Expect similar small speedups elsewhere.)

Change-Id: I08f87769ea3c9f06ad13d2b1d5326e542b9b63a8
Reviewed-on: https://skia-review.googlesource.com/20903
Reviewed-by: Herb Derby <herb@google.com>
Commit-Queue: Mike Klein <mtklein@chromium.org>

4 files changed

tree: 2fca874afd369944d62f7d704b8a8459c70f3866