Dividing unsigned 8-bit numbers を読んだ。
- 除算のSIMD実装を説明している記事である
- 浮動小数点と筆算での実装をしている
SIMDはやはりよく分からない。また読んでみよう。
備考: 記事内のコードは以下のようにして、 でコンパイルできた。
#include <immintrin.h> #include <stdint.h> void avx512_long_div_u8(const uint8_t* A, const uint8_t* B, uint8_t* C, size_t n) { // ... }