Look back on the week.
-
English
- 1/7回受講
- 年末年始もあってあまり受けれず
-
Machine learning / Cloud computing
- Apache TVM関連活動
- Use shallow clone when cloning tensorflow repo by mshr-h · Pull Request #9864 · apache/tvm
- Dockerイメージ作成時にTensorFlowリポジトリを全部取ってきていたので、shallow cloneにして取得サイズを削減した
- [Caffe Frontend] Add support for Power layer by KennyTang1988 · Pull Request #9655 · apache/tvm
- CaffeのPower layerサポート追加PRに対してコメントした
- Use shallow clone when cloning tensorflow repo by mshr-h · Pull Request #9864 · apache/tvm
- TinyML Book Screencast #4 - Quantizationを見た
- プレゼン資料
- Advanced uses for quantization
- model compression
- inference calculations
- training calculations
- asymmetric vs symmetric
- asymmetricだとqunatize後の値をcalculationに使えない
- symmetricだと0.0が0にマップされる
- per-filter scaling
- Convolutionのfilterごとにquantizationのrangeを持つ
- OpenAI GymをJupyterでrenderする
- mario-rlで遊んでる
-
Rock climbing
- 今週は4回登った
- 打ち込んでた初段も登れてhappy
- FrictionLabsのBAM BAM
- 2週間ぐらい使ってるが非常に良い
-
Other topics
- 物体検出ライブラリの紹介と所感 - arutema47’s blog
- yolov5はライセンスがGPL 3で使いづらい
- 2022年に注目したいCloudNative関連技術:新春特別企画|gihyo.jp … 技術評論社
- eBPF、WebAssembly、WASMランタイム
- Lessons from my PhD - Austin Z. Henley
- 良い
- 論文の読み方 / How to survey - Speaker Deck
- 「論文の研究上の位置づけを把握する」
- sharkdp/hyperfine: A command-line benchmarking tool
- A command-line benchmarking tool.
- コマンドを複数回実行してベンチマークできるツール
- コンパイラが作ったバイナリをつなぎ合わせるプログラム 「lld」の作者が語る、リンカの仕組み - ログミーTech
- 並列データ構造
- 並列コンテナ
tbb::concurrent_hash_map
- 複数スレッドから同時に要素を挿入できるマップ
- スレッド数に応じてスケールする
- 速いプログラムを書くためのポイント
- 推測せずに計測する
- 「凝ったコードを書くのではなく自然と速くなるようなデータ構造を考えて作る。コードでプログラムを速くすることはできません。データを工夫するほうが速くなるのでデータ構造を考えましょう。」
- 「手が速いほうが速いプログラムが書けます。つまり、たくさん実装して一番速いものを選ぶ。結局作ってみないとわからないので、作って計測して一番速いものを選ぶ必要があります。」