大语言模型节省一半算力的最简单方法:只用中文为唯一推理语言

李金宝

PROPOSAL · v1.0 · 2026-03-25 · human

Formal Sciences Computer Science Artificial intelligence and machine learning

Abstract

本文涉及大语言模型的几项改进意见: 1. 语言模型只用一种推理语言,而且是中文,就能大幅减少算力。1.1 只使用一种语言。可以减少token词表中的token数量,减少输出层的计算。实现方法:添加语言选择按钮,最好是前置翻译软件,将其他语言翻译成中文。1.2 语言模型的推理语言最好是中文:1.2.1 中文的字,1字1token,就能利用语义融合技术生成词组,减少词组token数量。1.2.2 只使用常用字,字token数量可以减少到5千个。1.2.3 中文词组语义单一。每个词组token只需要更少的向量就能表达全部语义。 2.解决中文分词难题的方案:输入法输出中文的字和词时自动添加隐形空格或其他标记。 3.减少符号的向量,以减少算力。

Keywords

分词 语言模型 AI

Download PDF