首页

登录

用“Token”还是“词元”？AI命名背后的霸权之争

3 个月前

AI资讯

34 阅读

[人工智能术语争议文化自主性技术话语权]

随着人工智能技术在全球范围内迅速发展，“Token”这一概念的翻译问题在中国引发了广泛讨论。有人主张沿用英文原词，有人提出使用“词元”，也有人建议改用更具象的“智元”。这一看似语言层面的争议，背后却是技术定义权、文化自主性与全球AI话语权的深层博弈。

1. “Token”在AI语境中的多义性与翻译困境

Token 在计算机科学中本就具有多种含义：
- 在自然语言处理中，Token通常指代一段文本中被切分出的最小语义单位。
- 在区块链领域，Token是代币或数字资产。
- 在编程中，Token可能是关键字、标识符或运算符等。
随着AI多模态处理的发展，Token早已不限于“词”的范畴：
- 图像、音频、视频等非文本数据同样被切分为Token进行模型处理。
- 因此，“词元”这一译法逐渐显得局限，无法准确反映AI新时代的特征。
语言学和翻译界的分歧持续存在：
- 有人坚持认为“词元”在语义上已经足够贴近。
- 有人则主张应创造一个更符合技术本质的新词，如“智元”。

2. 术语背后的技术定义权之争

技术术语的命名权往往掌握在最早研发该技术的国家或机构手中：
- Token一词最早由美国AI研究者使用，随着GPT等模型的普及成为全球标准。
- 中国若要争取AI术语的话语权，必须从定义开始参与构建。
使用中文译名不仅是语言选择，更是一种文化认同的体现：
- 使用原词Token容易造成“概念依赖”，削弱本土创新能力的表达。
- 翻译成“词元”或“智元”，则可能推动中文社区对AI概念的本土化理解和传播。
命名之争也关乎AI知识体系的构建：
- 杨斌教授指出，术语的定性关系到技术的普及与标准化。
- 若长期沿用英文术语，将不利于中文技术文档、教育材料的系统性发展。

3. 社会反响与行业态度分化

民众与技术人员对“词元”译法态度两极：
- 支持者认为这体现了文化自信和技术自主意识。
- 反对者则质疑“强行翻译”是否必要，认为国际通用术语更利于协作。
学术界存在两种主流态度：
- 一种是《Token命名困境》作者所代表的“不可译论”，主张保留英文术语。
- 另一种是积极推动“智元”等新词创造的“重构派”，强调中文在AI时代的表达能力。
行业实践层面尚未统一：
- 大型科技公司和研究机构中英文混用普遍。
- 教育与科普领域则更多尝试使用中文译名。

4. 黄仁勋眼中的Token未来与AI经济

NVIDIA创始人黄仁勋对Token的未来定位非常明确：
- 他认为数据中心将转型为AI工厂，以生成Token为核心任务。
- Token将成为AI时代的企业营收核心。
他预测到2027年，AI服务将以Token为计价单位大规模交易：
- 类似于云计算按资源使用计费的方式。
- Token将不仅是技术术语，更是经济单位和商业指标。
这种观点加剧了术语本地化的紧迫性：
- 如果中文社区长期依赖英文术语，在AI商业体系构建中将处于被动地位。
- 如何在保留技术本质的同时，赋予中文术语新的商业和技术内涵，成为必须解决的问题。

5. 命名之争的深层意义与未来展望

Token的中文翻译之争本质上是AI技术主导权之争：
- 中文社区是否能主导AI概念的定义与表达。
- 是否能在全球AI发展路径中，形成具有中国特色的理论与实践体系。
未来可能的发展方向：
- 多译并存：在不同语境下使用“Token”“词元”“智元”，形成语义分层。
- 政策推动：国家科技主管部门或语言规范机构介入术语统一工作。
- 教育普及：通过教材、课程推广标准化译法，增强中文术语影响力。
不论最终采用何种命名方式，这场讨论的意义在于：
- 引发对中文在科技前沿领域表达能力的重视。
- 推动AI术语体系的规范化与本地化建设。
- 为未来更多AI新词的诞生预留空间，建立机制化的术语生成与采纳流程。