当前位置: 首页 > 新增资讯 > DeepSeek“悄悄”上线全新模型,或触发硬件光计算革命

DeepSeek“悄悄”上线全新模型,或触发硬件光计算革命

2025-10-30 14:50:38 来源:21世纪经济报道

DeepSeek“悄悄”上线全新模型,或触发硬件光计算革命

21世纪经济报道记者邓浩

日前,DeepSeek在人工智能开源社区Hugging Face上推出了全新的多模态模型DeepSeek - OCR。

这一成果迅速在产业界激起热烈探讨。在华为旗下的学术平台“黄大年茶思屋”上,有技术专家指出,该模型核心构件视觉encoder的高效解码,为光计算和量子计算引入LLM(注:大语言模型)领域提供了明确的技术途径。

10月29日,图灵量子相关负责人接受21世纪经济报道记者采访时称,DeepSeek - OCR技术能更高效地发挥光计算高并行性和低功耗的优势,相信不久后就会出现光计算芯片结合大模型的应用。

光学压缩破局

一直以来,上下文长度是制约大模型性能的关键瓶颈。例如,上下文窗口过小,会使模型无法一次性读取用户之前输入的信息(如文章),影响推理的准确性。

针对这一痛点,业内提出了稀疏注意力、检索增强生成等多种技术来应对。此次,DeepSeek首次提出“上下文光学压缩”(Contexts Optical Compression)技术,通过将文本当作图像处理,实现信息的高效压缩,理论上甚至能实现无限上下文。

黄大年茶思屋上的技术专家乔楠认为,DeepSeek此次推出的新模型,本质上是对人脑遗忘机制的模拟。简单来说,通过将文本作为图像处理,可实现7 - 20倍的token压缩。以一页文本为例,通常需要2000 - 5000个文本tokens,转换为图像后仅需200 - 400个视觉tokens。10倍压缩时能保持97%的解码精度,20倍压缩时仍有60%的精度。而这是实现LLM Memory遗忘机制的关键所在。

在乔楠看来,通过将多轮对话中的历史上下文渲染成图像,LLM可以像人一样遗忘。比如近期的对话(如k轮内)保持高分辨率的文本形态;而更早的历史(k轮外)则被压缩成图像。随着时间推移,这些“记忆图像”可逐步降采样或缩小(变得更模糊),从而占用更少的Token,模拟人类记忆中“近期信息高保真、远期信息自然褪去”的生物遗忘曲线。

上述图灵量子负责人也表示,“DeepSeek - OCR技术将文本渲染为图像后作为视觉信息处理,大幅减少数据分割和组装的操作次数,进而降低整体计算负荷。这种数据的编码机制,减轻了对后端计算硬件(无论是电芯片还是光芯片)在规模和精度上的直接压力。”

进一步而言,针对光计算,该负责人认为,“(此模型)同样也能减少光电转化的次数,从而更有效地发挥光计算高并行性和低功耗的优势,相信很快就会有光计算芯片结合大模型的应用出现。”

或触发硬件革命

通过将文本问题转化为图像问题,DeepSeek的OCR技术有可能为光计算芯片进入大语言模型创造条件。

光计算芯片被誉为“后摩尔时代”的潜力技术,它利用光速传输、高并行性和低功耗的特性,为AI等计算密集型任务带来了新的可能。

乔楠认为,光计算的核心优势之一是能以极快速度和极低功耗执行特定计算,如图形处理中常见的傅里叶变换和大规模并行处理。以前引入光计算最大的问题是序列的上下文过长,光芯片无法做得足够大,现在deepseek - ocr提出了光学编码的原生机制,解决了引入光芯片的最大难题。

在乔楠的设想中,DeepSeek - OCR的DeepEncoder(视觉编码器)部分,会是一个非常适合由光学协处理器执行的模块。但文本解码(Decoder部分)仍由电子芯片(GPU/NPU)处理。另外记忆的压缩(文本 ->图像 ->视觉Token)则可完全交由光计算芯片,实现最优分工。

不过,受技术、制造、生态等多种条件限制,光计算芯片目前仍处于产业化初期。前述图灵量子负责人表示,光芯片目前主要有两个问题需要解决,一是先进光电融合封装,要使光源、芯片和探测器件高效集成在芯片上,并确保它们与电子控制单元稳定协作,这是发挥光计算优势的集成。其次整个光计算的软件生态还不够成熟,导致大规模开发和优化光计算应用仍存在挑战。

据了解,国内主要参与者有曦智科技、图灵量子、光本位等公司,国外有Lightmatter、Lumai、Cerebras Systems等厂家。其中,图灵量子一直围绕薄膜铌酸锂(FTLN)开展各方面研究,具备从设计、版图、流片、测试到封装的全流程能力,经过多年的技术迭代和优化,已在TFLN产品方面实现规模化量产。

图灵量子负责人坦言,“光计算芯片已进入产业化的早期阶段,但要在数据中心里与GPU竞争,可能还需要3 - 5年时间来攻克工程、成本和生态方面的难题。”




(文章来源:21世纪经济报道)


原标题:DeepSeek“悄悄”上线全新模型,或触发硬件光计算革命

郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。        

热门企业

河南林晖实业有限公司 海南洋浦博施娱乐有限公司 江苏宏晶物联网有限公司 广东全宇医疗投资有限公司 珠海乾新股权投资中心(有限合伙... 大同同承投资有限公司 珠海闰宝房地产有限公司 悦宝医疗器械股份有限公司 连云港瑞天富压延有限公司 启视(海南)眼科生物医疗科技有... 北京瑞隆实业投资有限公司 辽阳市财政事务服务中心(辽阳市... 长春滨湖房地产开发有限公司 国甄农品(北京)供应链管理有限... 西藏鸿基新能源开发有限责任公司 大连启明星辰科技有限公司 河南农投金控股份有限公司 江苏芯峰新能源科技有限公司 天津筑诚兴业有限公司 天津凡晟电气设备安装有限公司 福建日一建筑工程有限公司 广西禾晟生态科技有限公司 宁波兆信房地产有限公司 绍兴弹力丝厂 唐玺置业有限公司 湖北荆楚湖建设工程有限公司 上海庆利投资管理中心(有限合伙... 嘉兴赣信三期投资合伙企业(有限... 和合创业投资(广州)合伙企业(... 大连长嘉贸易有限公司

快速导航

联系方式

  • 联系电话:400-900-6808
  • E-mail:service@zyyx.cn
  • 客服微信:xinchacha2024
  • 7*24小时人工服务

数据来源

  • 全国企业信用信息公示系统
  • 中国裁判文书网
  • 中国执行信息公开网
  • 国家知识产权局
  • 商标局
  • 版权局

关于我们

  • 关于我们
  • 联系我们
  • 用户协议
  • 隐私协议
  • 信用通线上协议
  • 加密保线上协议

信查查官方微信

电话

400-900-6808

客服

小程序

APP