FPGA 推論向けの量子化ニューラル・ネットワーク
ニューラル・ネットワークの低精度の量子化は、同じフットプリントで、より高いスループットを実現したり、リソースの使用量を削減したりすることで、AI アプリケーションの仕様をサポートします。ブロック浮動小数 (BFP) は特にこのシナリオで有用です。その高いダイナミックレンジにより、低精度でも正確性を維持できるからです。正確性が低下する場合でも、当社のオープンソース・ソフトウェアを使用した再トレーニングにより、回復できます。
ニューラル・ネットワークの低精度の量子化は、同じフットプリントで、より高いスループットを実現したり、リソースの使用量を削減したりすることで、AI アプリケーションの仕様をサポートします。ブロック浮動小数 (BFP) は特にこのシナリオで有用です。その高いダイナミックレンジにより、低精度でも正確性を維持できるからです。正確性が低下する場合でも、当社のオープンソース・ソフトウェアを使用した再トレーニングにより、回復できます。