百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

DeepSeek内部数据库泄露;ChatGPT仿DeepSeek升级推理交互;Claude全球服务宕机 | 极客头条

cac55 2025-02-28 15:00 13 浏览 0 评论

「极客头条」—— 技术人员的新闻圈!

CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。

整理 | 箭蛙
出品 | CSDN(ID:CSDNnews)

一分钟速览新闻点!

  • 前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

  • DeepSeek 内部数据库因配置问题暂时可被访问

  • ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

  • Claude 全球服务突发中断,Anthropic 紧急启动故障排查

  • 阿里宣布 Qwen2.5-Max 旗舰模型 API 定价

  • 吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

  • 谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

  • OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

  • 扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

  • DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

  • OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

  • Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

  • 微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

  • PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布


国内要闻

前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

前阿里钉钉事业部副总裁张斯成在社交媒体发文,就近期 DeepSeek 相关热议分享看法,指出网传“黄教主给股东的信”和“梁文峰的公开信”均为杜撰。他认为 DeepSeek 在技术层面确有创新,主要聚焦于提升算力效率和算法有效性,但关于 PTX 调用是否规避 CUDA 限制仍存在专业争议。

张斯成指出,目前事态发展面临挑战:一方面是外媒对其训练成本的质疑,另一方面是将其过度解读为中美科技竞争。他呼吁给予这一国内优秀开源项目更多包容和发展空间。

他同时强调,尽管 DeepSeek 带来突破,但算力仍是行业刚需,只是市场对高端算力稀缺性的焦虑有所缓解。他建议 DeepSeek 加强危机公关管理,避免陷入不必要的争议。

DeepSeek 内部数据库因配置问题暂时可被访问

外媒 TechCrunch 报道,云计算公司 Wiz 的安全研究人员发现并报告了 DeepSeek 一个数据库的配置问题。该数据库包含用户聊天记录和 API 密钥等信息。Wiz 团队表示,这是由数据库访问权限的默认配置导致,在收到通知后,DeepSeek 已及时调整了相关配置。目前尚无法确认该配置持续了多长时间,以及是否有其他访问情况。

阿里宣布 Qwen2.5-Max 旗舰模型 API 定价

阿里云通义千问今日宣布其新一代模型 Qwen2.5-Max 的 API 定价:输入令牌价格为每百万/ token 1.6 美元,输出令牌价格为每百万/ token 6.4 美元。

此前,Qwen2.5-Max 模型凭借其在大规模 MoE(混合专家)模型领域的研究成果,在 Arena Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等多个基准测试中展现出优异性能。目前,用户可以通过通义千问官方网站的在线对话服务、API 接口以及 Hugging Face 演示平台等多个渠道使用该模型。


国际要闻

吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

AI 领域知名学者吴恩达近日发表观点,认为 DeepSeek 的爆发性增长揭示了当前 AI 发展的四个重要趋势:

  • 首先,中国在生成式 AI 领域正快速追赶美国。他指出,过去两年中美差距显著缩小,包括 Qwen、Kimi、InternVL 和 DeepSeek 等中国模型在多个领域展现出强劲实力,部分领域甚至已现领先迹象。

  • 其次,开源权重模型正推动基础模型层“民化”。以 DeepSeek-R1 为例,其每百万 token 定价仅为 OpenAI 的 1/30,大幅降低了开发和使用成本,为应用开发者创造了新机遇。

  • 第三,算法创新正成为 AI 发展的重要路径。受限于硬件条件,DeepSeek 团队通过算法优化,仅用不到 600 万美元的算力成本就完成了模型训练,展示了规模扩张并非进步的唯一途径。

  • 最后,开源模式对 AI 供应链具有重要意义。吴恩达表示,如果美国持续限制开源发展,中国可能在 AI 供应链中占据更重要地位。

Claude 全球服务突发中断,Anthropic 紧急启动故障排查

AI 公司 Anthropic 今日发布服务异常通告,其旗下产品 Claude 的全球服务出现大规模中断。故障表现为用户登录 claude.ai 时遭遇 502 网关错误,出现身份认证失效提示。监测数据显示,中断期间 API 调用失败率峰值达 82%,控制台仪表盘数据延迟超过 15 分钟。

OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

财联社报道,软银正主导 OpenAI 新一轮融资,计划投资 150 亿至 250 亿美元。此轮融资总规模预计达 400 亿美元,将使 OpenAI 估值升至最高 3400 亿美元,较去年 10 月 1570 亿美元的估值翻倍。

部分资金将用于支持 OpenAI 履行在"星际之门"项目中约 200 亿美元的出资承诺,该项目初期投资额为 1000 亿美元,由 OpenAI、软银各投 190 亿美元,甲骨文和阿布扎比 AI 公司 MGX 投资 70 亿美元。剩余资金将用于支持 OpenAI 业务运营。

谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

谷歌今日宣布在 Gemini 应用中推出 Gemini 2.0 Flash 模型,声称是“为了 Agent 时代设计的最新型号”。该模型在多项关键基准测试中展现出更快的响应速度和更强的综合性能,适用于头脑风暴、学术辅助和文本创作等日常场景。官方数据显示,2.0 Flash 的单次推理延迟较前代模型降低 43%,在逻辑推理类任务中的准确率提升 19%。

Gemini Advanced 用户将继续享有 1M token 上下文窗口支持,可处理长达 1,500 页的文档上传,并拥有深度研究(Deep Research)和专属技能包(Gems)等功能的优先使用权。同步升级的还有图像生成模块——最新版 Imagen 3 在细节丰富度和纹理表现力上达到新高度,能更精准理解用户指令完成创意可视化。

目前 2.0 Flash 已通过 Gemini 网页端和移动端向全球用户开放。为保障用户体验连续性,Gemini 1.5 Flash 和 1.5 Pro 版本将在未来数周内继续保留现有对话功能。

ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

ChatGPT 近期悄然进行了界面更新,新增了一个灯泡图标功能,用户点击后可切换“Use more intelligence”(使用更多智能)和“Think”(思考)两种模式。这一设计使其推理思考功能更加直观可见,与近期广受关注的 DeepSeek 采用了相似的交互方式。

此次更新似乎正在进行灰度测试,不同用户收到的更新内容略有差异。例如,部分 Mac 版本用户发现模型选择按钮除了原有的顶部位置外,现在在输入栏也能进行切换,提供了更便捷的操作方式。

扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

Meta CEO 马克·扎克伯格在 Facebook 上透露,作为下一代开源 AI 模型,Llama 4 的研发正在稳步推进。其中,Llama 4 Mini 已完成预训练阶段,推理模型和更大规模的模型也展现出良好成果。

与此前 Llama 3 着重于让开源模型追赶封闭模型的目标不同,Llama 4 的定位是成为行业领导者。扎克伯格表示,Llama 4 将是一个原生的多模态“全能模型”,具备智能体能力(agentic capabilities),有望解锁更多新的应用场景。相关详细计划将在未来几个月内陆续公布。

对于 2025 年的 AI 发展,扎克伯格预测将出现重要突破:AI 智能体(agent)有望达到中级工程师水平,具备编程和解决问题的能力。他认为,这将成为历史上最重要的技术创新之一,率先实现这一目标的公司将在 AI 研究和行业格局中占领先优势。

DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

AI 芯片公司 Cerebras 今日宣布,DeepSeek R1 70B 模型已在其平台上线。该版本结合了完整版 R1 的推理能力和 Llama 70B 的规模优势,在通用和推理基准测试中的表现超越了 GPT-4o 和 o1-mini,被认为是目前性能最强的 Llama 70B 变体。

在 Cerebras 平台上,R1 70B 的推理速度达到每秒 1,500 个 token,比 GPU 解决方案快 57 倍。例如,在代码生成任务中,Cerebras 平台仅需 1.5 秒即可完成,而 o1 mini 则需要 22 秒。

OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

OpenAI 今日宣布,面向欧盟、挪威、冰岛、列支敦士登和瑞士的用户推出多项新功能。ChatGPT 移动应用的高级语音功能(Advanced Voice)现已支持视频和屏幕共享功能,这项功能此前于 2024 年 12 月首次在其他地区推出。

同时,OpenAI 还在这些地区的 chatgpt.com 网站和 Windows 桌面应用上推出了更新版的自定义指令功能。该功能于 1 月 18 日首次发布,通过全新的用户界面,允许用户自定义 ChatGPT 的回应方式,包括设定其性格特征、对话风格以及遵循的规则等。

这两项功能的欧洲区域推出,标志着 OpenAI 继续扩大其全球服务范围,为更多地区的用户提供完整的 ChatGPT 体验。

Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

Waymo 今日宣布在亚特兰大开启完全无人驾驶模式测试,目前仅面向其员工开放。该公司表示,这一进展建立在其在旧金山、凤凰城、洛杉矶和奥斯汀等城市累计超过 3300 万英里自动驾驶经验的基础之上。

Waymo 计划于今年晚些时候通过与 Uber 的独家合作,在亚特兰大向公众推出商业化无人驾驶出租车服务。此外,该公司还将目标瞄准迈阿密市场。目前在奥斯汀的服务仍处于候补名单阶段。


程序员专区

微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

微软宣布在其 Azure AI 和 GitHub 平台上正式提供 DeepSeek R1 模型服务。开发者现可通过 Azure 一键部署方案快速集成该模型,免去复杂的基础设施搭建过程。微软表示已对模型进行安全测试并集成内容安全过滤功能。

值得注意的是,微软计划推出 R1 的精简版本,使其能够在 Copilot Plus PC 上本地运行。开发者可通过 Azure 账号直接调用 API,或在 GitHub 平台获取更多开发资源和集成指南。

此前,微软曾向所有 Copilot 用户免费提供 OpenAI 的 o1 推理模型。

PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布

PyTorch 团队近日发布 2.6 版本,带来多项重要更新:torch.compile 现已支持 Python 3.13,新增性能控制参数 torch.compiler.set_stance,以及多个 AOTInductor 改进。此外,该版本还为 X86 CPU 添加了 FP16 支持。

相关推荐

如何屏蔽色情网站?_怎么能屏蔽网站

一、基础防御:全网DNS劫持阻断1.修改全网DNS服务器推荐DNS:安全DNS:CleanBrowsing(成人内容过滤):185.228.168.168/185.228.169.168Open...

容器、Pod、虚拟机与宿主机网络通信全解:看这一篇就够了

在日常开发与部署过程中,很多人一开始都会有这样的疑惑:容器之间是怎么通信的?容器怎么访问宿主机?宿主机又如何访问容器?Kubernetes中Pod的网络和Docker容器一样吗?容器跨机器是...

Win11专业版找不到共享打印机的问题

有很多深度官网的用户,都是在办公室上班的。而上班就需要使用打印机,但更新win11系统后,却出现同一个办公室里面的打印机都找不到的问题,这该如何处理呢?其实,可能是由于我们并没有打开共享打印机而造成的...

常用电脑快捷键大全,摆脱鼠标依赖,建议收藏

Ctrl+C复制Ctrl+X剪切Ctrl+V粘贴Ctrl+Z撤销Ctrl+Y重做Ctrl+B加粗Ctrl+A全选所有文件Ctrl+S保存Ctrl+N新建Ctrl+O打开Ctrl+E...

Win11实现自动追剧Jellyfin硬解,免NAS复杂操作

大家好,欢迎来到思赞数码。本期将详细介绍如何通过安装和配置Sonarr、Radarr、Prowlarr、qBittorrent和Jellyfin,打造一套自动化的影视管理系统。很多人认为,要实现自动追...

微软Win11安卓子系统WSA 2308.40000.3.0更新推送下载

IT之家9月21日消息,微软官方博客今日宣布,已面向所有WindowsInsider用户推送了Windows11安卓子系统的2308.40000.3.0版本更新。本次更新和之前...

路由器总掉线 一个命令就能猜出八九分

明明网络强度满格或有线图标正常,但视频卡成PPT、网页刷不开、游戏动不了,闲心这些问题很多小伙伴都碰到过。每次都要开关路由、宽带/光猫、插拔网线……一通忙。有没有啥办法能快速确定故障到底在哪儿,方便处...

windows电脑如何修改hosts文件?_windows怎么修改hosts

先来简单说下电脑host的作用hosts文件的作用:hosts文件是一个用于储存计算机网络中各节点信息的计算机文件;作用是将一些常用的网址域名与其对应的IP地址建立一个关联“数据库”,当用户在浏览器中...

win10广告弹窗ShellExperienceHost.exe

win10右下角老是弹出广告弹窗,排查为以下程序引起,但是这个是系统菜单的程序不能动:C:\Windows\SystemApps\ShellExperienceHost_cw5n1h2txyewy\S...

Win10 Mobile预览版10512/10166越狱解锁部署已被黑客攻破

看起来统一的WindowsPhone和Windows越加吸引人们的关注,特别是黑客们的好奇心。XDA论坛宣称,在Win10Mobile预览版10512/10166上,已取得越狱/解锁部署突破,比如可...

6款冷门小众软件,都是宝藏,建议收藏

真的很不错(。-ω-)zzzBearhttps://bear.app/cn/Bear是一个漂亮,灵活的Markdown的写作工具。它一样只支持苹果家的全平台。它一出现就惊艳四方,就被AppSto...

如何让不符合条件的设备升级Windows 11

如果你是最近(6月24日之后)加入WindowsInsider项目并且你的设备并不符合升级条件,那么当你在尝试升级Windows11的时候可能会看到以下错误:你的PC不符合Wi...

windows host文件怎么恢复?局域网访问全靠这些!

windowshost文件怎么恢复?windowshost文件是常用网址域名及其相应IP地址建立一个关联文件,通过这个host文件配置域名和IP的映射关系,以提高域名解析的速度,方便局域网用户使用...

Mac Hosts管理工具---SwitchHosts

switchhosts!formac是一款帮助用户快速切换hosts文件的工具,switchhosts!formac能够帮助你快速方便的打造个人专用的网络环境,支持本地和在线两种方式,并且支持...

「浅谈趣说网络知识」 第十二弹 老而不死的Hosts,它还很有用

【浅谈趣说网络知识】第十二弹老而不死的Hosts,它还很有用什么时候才觉得自己真的老了,不是35岁以上的数字,不是头上的点点白发,而是不知觉中的怀旧。风口上的IT界讲的就是"长江后浪推前浪...

取消回复欢迎 发表评论: