商傳媒|責任編輯/綜合外電報導
騰訊近日發布了新版人工智慧模型 Hy3,這是該公司自從延攬前 OpenAI 研究科學家 Yao Shunyu 以來的首次重大模型更新。此舉顯示騰訊正積極加碼人工智慧領域,旨在全球激烈競爭中佔據一席之地。
根據《Computerworld》報導,騰訊計畫今年將其人工智慧投資倍增至超過 50 億美元。新推出的 Hy3 模型在複雜推理和程式設計方面展現改進,希望能在中國市場與字節跳動、阿里巴巴以及 DeepSeek 等主要競爭者抗衡。早在 2023 年,騰訊就曾宣稱其 Hunyuan 大型語言模型(LLM)能力優於當時的 ChatGPT 和 Llama 版本。
與此同時,中國 AI 新創公司 DeepSeek 也推出了其 V4 Flash 和 V4 Pro 系列大型語言模型。據《MIT Technology Review》報導,DeepSeek V4-Pro 的性能已能媲美頂尖的閉源模型,包括 Anthropic 的 Claude-Opus-4.6、OpenAI 的 GPT-5.4 和 Google 的 Gemini-3.1。該模型在程式設計、數學和 STEM 問題上的表現尤為突出,超越了阿里巴巴的 Qwen-3.5 和北京智譜華章科技有限公司(Z.ai)的 GLM-5.1 等其他開源模型。
DeepSeek V4 模型在處理長文本方面也實現顯著進步,其預設的上下文視窗高達 100 萬個 token,與 Gemini 和 Claude 等領先模型看齊。這項技術的突破得益於全新的「混合注意力架構」(Hybrid Attention Architecture),能夠更好地理解提示中的各部分關聯,有效解決了長上下文模型在記憶和理解上的挑戰。








