update_wint2_doc (#3968)

This commit is contained in:
AIbin
2025-09-08 15:53:09 +08:00
committed by GitHub
parent 83bd55100b
commit 316ac546d3
4 changed files with 2 additions and 2 deletions

View File

@@ -5,7 +5,7 @@
- **支持结构**MoE结构
该方法依托卷积算法利用重叠的Bit位将2Bit的数值映射到更大的数值表示空间使得模型权重量化后既保留原始数据更多的信息同时将真实数值压缩到极低的2Bit大小大致原理可参考下图
[卷积编码量化示意图](./wint2.png)
![卷积编码量化示意图](./images/wint2.png)
CCQ WINT2一般用于资源受限的低门槛场景以ERNIE-4.5-300B-A47B为例将权重压缩到89GB可支持141GB H20单卡部署。