今後は Wardite の高速化をしたいと思います

    # @rbs code: Symbol
    # @rbs return: Array[Symbol]
    def self.operand_of(code)
      case code
      when /load/, /store/
        [:u32, :u32]
      when :local_get, :local_set, :local_tee, :global_get, :global_set, :call, :br, :br_if
        [:u32]
      when :memory_init, :memory_copy
        [:u32, :u32]
      when :memory_size, :memory_grow, :memory_fill
        [:u32]
      when :call_indirect
        [:u32, :u32]
      when :br_table
        [:u32_vec, :u32]
      when :i32_const
        [:i32]
      when :i64_const
        [:i64]
      when :f32_const
        [:f32]
      when :f64_const
        [:f64]
      when :if, :block, :loop
        [:u8_block]
      else
        []
      end
    end

今後は Wardite の高速化をしたいと思います

Presentation by Uchio Kondo

福岡市博多区 中央区から来ました

self.introduce!

今日話すこと

主にWarditeの高速化の話

バイナリパースの高速化

環境

ruby.wasm の実行

vernier でのflame graph

vernier のflame graph 所感

バイナリ解析のみのベンチプログラム

今のmainでの結果

flame graph

やったことをつらつらと

Op.to_sym, Op.operand_of 最適化

重そうな処理を削る

さらにシンボルテーブル探索の最適化

これだけで割と改善

fetch_ops_while_end の最適化

fetch_ops_while_end の最適化

そもそも

結果

Opインスタンスを作るのをやめる

Opインスタンスを作るのをやめる

Opインスタンス→配列

Opインスタンス→配列

ポイント

結果は？

さらに高速化の余地は？

namespace の算出をやめてみた結果

さらに細かい改修

operand情報解決テーブルの事前作成

leb128 の処理の高速化

leb128 がなぜ大事か

ほとんどの数値は1バイトのはず...

この辺を適用した結果

と思ったが...

最終的なflame graph

変化のまとめ

ruby --version 現状の所要時間

リリース済み

Sidetrack

VM処理側も高速にしたいね

値をIntegerだけで表現する

値は大量にオブジェクトを作る

浮動小数点数を32bit/64bitのIntegerで表現する

結果はまだまだ

今後はこうしていこうと思っています

Conclusion

Warditeのバイナリパーサを高速化した

福岡市博多区中央区から来ました

`Op.to_sym`, `Op.operand_of` 最適化

`fetch_ops_while_end` の最適化

`fetch_ops_while_end` の最適化