足球动态
足球动态
- 合肥市青少年足球联赛启航波胆足球 - 专
- 波胆足球 - 专业波胆比分推荐平台 实
- 波胆足球 - 专业波胆比分推荐平台 实
- 波胆足球 - 专业波胆比分推荐平台 实
- 2026年世界杯扩军至48队:史上最大规
联系我们
电话:400-123-4567
手机:138-0000-0000
邮箱:admin@youweb.com
地址:广东省广州市天河区88号
波胆足球
波胆足球 - 专业波胆比分推荐平台 实单分享+稳胆计划o3精准扒出照片位置细思极恐21岁小伙开发AI作弊工具被停学转头拿530万美元融资Hunt Good周报
- 作者:小编
- 发布时间:2025-07-09 08:31:28
- 点击:
波胆足球,波胆推荐,英超波胆预测,波胆比分,波胆实单OpenAI o3 自发布以来,因准确的照片地理定位能力引发了广泛的关注。
最近,Lanyrd 联创、Django Web 框架缔造者 Simon Wilson 向 o3 提供了一张在加利福尼亚州埃尔格拉纳达拍摄的普通照片。
照片中仅有一条道路、一座普通住宅和远处的山丘,没有明显的地标建筑。而 o3 通过详尽分析照片中的各种细节元素,最终给出了极为接近的答案。
在分析过程中,o3 展示了类似「放大」功能的能力,它可以将照片的特定区域进行裁剪并放大观察,例如查看车牌、植被类型和建筑风格等细节。
通过识别照片中的花、橄榄树、柔和色调的海滩小屋、白色栅栏以及背景中的沿海丘陵等特征,o3 首先猜测是加利福尼亚的坎布里亚,随后提出的备选答案「半月湾-埃尔格拉纳达」恰好命中了照片的实际拍摄地点。
Simon 认为这种地理定位能力并非 o3 独有。Claude 3.5 和 3.7 Sonnet 等其他先进 AI 模型同样展示出类似的能力,尽管它们的「放大」功能可能不如 o3 那么引人注目。
今年 3 月,OpenAI 表示计划在今年某个时间点发布自 GPT-2 以来,首个开源语言模型。而据 TechCrunch 援引知情人士消息,该开源模型的更多细节被曝光:
OpenAI 研究副总裁 Aidan Clark 目前正在主导该模型开发,项目进度处于非常早期的阶段。OpenAI 的目标是今年初夏能发布该模型;
该开源模型将类似于 OpenAI 的 o 系列推理模型,并且 OpenAI 希望这一模型的基准测试成绩,能够超越 Meta 和 DeepSeek 等竞争对手的开源推理模型;
该开源模型采用「文本输入/输出」的交互模式,并且将允许开发者自由开关「推理」功能,由开发者自己选择结果生成速度。值得一提的是,若该模型反响够好,OpenAI 还可能推出更小尺寸的模型。
此外,据知情人士透露,这款开放模型将采用一种名为「交接」的机制,能够连接到 OpenAI 的云托管模型以更好地处理复杂查询。据悉,这一「交接」功能的构想最初是由一位开发者在 OpenAI 的开发者论坛上提出的,并在 OpenAI 内部获得了认可。
类似于苹果的 Apple Intelligence,该开放模型将能够调用 OpenAI 的 API 访问其他更大型模型,从而获得显著的计算能力提升。但目前尚不清楚该开放模型是否能够使用 OpenAI 现有模型的各种工具,如网络搜索和图像生成功能。
消息人士表示,OpenAI 正在从头开始训练这一新模型,而非简单改造旧模型。预计该开放模型性能将低于 OpenAI 的 o3 模型,但在某些基准测试中将优于 DeepSeek 的 R1 推理模型。
4 月 24 日至 26 日,由中国电子学会主办,无锡市惠山国有投资控股集团有限公司和中国人形机器人百人会共同承办的「首届具身智能机器人运动会」在江苏无锡市惠山区成功举办。
据悉,本次运动会吸引了超过 100 家科研团队、知名企业及高校代表参与,包括国家地方共建具身智能机器人创新中心、国家地方共建人形机器人创新中心、杭州宇树科技、深圳优必选科技等机构,参赛机器人数量超过 150 台。
比赛设置了竞技赛和应用赛两大类别,包含竞速跑、越野跑、足球、篮球、舞蹈、格斗、搬运、智能抓取、室内救援、创新场景共 10 个大项,评选出技术类、互动类、场景类、设计类四大类奖项,全面展示了具身智能机器人领域的最新技术突破和应用成效。
此外,运动会期间还同步开展了具身智能机器人整机和零部件对接活动,展示了人形机器人的核心零部件,如伺服系统、关节模组、谐波减速器、传感器和毫米波雷达等。
据彭博社消息,苹果 Siri 团队新上任的工程负责人 Mike Rockwell 正在对 Siri 的开发团队进行大幅度调整。
据知情人士透露,Rockwell 从 Vision Pro 的软件团队挖来多位得力干将,并替换了 Siri 项目原有的领导层。其中包含 Rockwell 的资深副手 Ranjit Desai,其此前在 Vision Pro 的开发中表现出色,目前在 Siri 团队中负责底层平台和系统组等核心工作。
据 The Information 此前消息和彭博社报道,苹果正致力于解决 Siri 的技术架构问题。Siri 曾计划采取「大小模型混合」的方式进行更新 —— 大模型通过云端计算,用于复杂任务;小模型本地计算,用于轻量化任务。但因两者无法同时高效运行,导致性能、功能问题不断。并且因云端计算涉及隐私问题,而团队内意见产生严重分歧。
因此,苹果现在转向单一大语言模型(LLM)架构,从而进行问题改善,但这一改变或会导致升级需要数年时间。另外,苹果计划接纳大型第三方应用开发商,以便更快地完善、上新部分功能。
值得一提的是,据 The Verge 报道,苹果在遭到美国国家广告审查部门(NAD)调查之后,已在 Apple Intelligence 的介绍页中删除了「现已可用(Available now)」标语。NAD 表示,苹果目前的功能体验与宣传的相差甚远,因此建议该公司「停止或修改」相关宣传语。
哥大两名学生开发 AI 作弊工具被停学,转身拿下 500 万美元融资
Cluely 公司开发的这款 AI 工具号称能够帮助用户「在一切事情上作弊」。
这家总部位于旧金山的初创公司源于一款名为 Interview Coder 的面试作弊工具,正是这款工具使 Lee 及其合伙人遭到哥伦比亚大学的停学处分。
Cluely 宣称,这款产品技术优势在于提供一个隐藏的浏览器窗口,从而让面试官或考试监考人无法察觉。通过这一工具,用户可在考试、销售电话和工作面试等各种场景中获取 AI 的实时帮助。
据 Lee 透露,这款 AI 作弊工具本月早些时候的年度经常性收入已超过 300 万美元。
Cluely 的另一位联合创始人兼首席运营官是同样 21 岁的前哥大学生 Neel Shanmugam,他也因该 AI 工具面临校方纪律处分。据哥伦比亚大学学生报纸报道,两位创始人均已从学校退学。
Cluely 最初的设计目的是帮助开发者在 LeetCode 等编程问题平台「作弊」。创始人认为,这类编程测试平台已经过时且浪费时间。
Lee 甚至声称他曾利用这款AI工具成功获得亚马逊的实习机会。对此,亚马逊方面拒绝对具体案例置评,但强调所有求职者必须承诺在面试过程中不使用未经授权的工具。
Google 被曝付费三星预装 AI 应用,多家巨头喊话收购 Chrome
据彭博社报道,Alphabet ( Google 母公司)每月向三星电子支付「巨额资金」,以确保其生成式 AI 应用 Gemini 预装在三星手机和设备上。
Google 负责平台和设备合作的副总裁彼得·菲茨杰拉德表示,该合作始于今年 1 月。根据合同条款,Google 将在至少两年内为每台预装 Gemini 的设备提供固定月度付款,并向三星支付一定比例的应用订阅和广告收入。
菲茨杰拉德承认,除 Google 外,三星还收到了来自微软、Meta 和 OpenAI 等竞争对手的「有竞争力的报价」。而去年,负责该案的法官阿米特·梅塔裁定 Google 向三星付费成为默认搜索引擎的做法违反了反垄断法。
数据显示,尽管 Gemini 用户量在过去六个月大幅增长,但仍落后于 ChatGPT。截至上月,Gemini 全球日活跃用户达 3500 万,月活跃用户 3.5 亿。
除此之外,AI 搜索引擎巨头 Perplexity 和老牌互联网巨头雅虎也纷纷表达了收购 Google Chrome 浏览器的强烈兴趣。
据彭博社援引知情人士透露,马斯克的 xAI 目前正与投资者洽谈,计划筹集大约 200 亿美元资金,用于其新合并的人工智能初创公司和社交媒体业务。
数据提供商 PitchBook 的数据显示,如果成功,这笔交易将成为历史上第二大创业公司融资,仅次于今年早些时候 OpenAI 的 400 亿美元融资。据知情人士透露,凭借此轮洽谈中的融资,xAI 的估值超过 1200 亿美元。
值得一提的是,该轮融资可能有助于偿还马斯克在将 X 前身 ——Twitter 私有化后所承担的一部分债务。知情人士透露,上述债务一直对 X 构成财务压力。此前彭博社报道指出,仅在今年 3 月,X 就支付了约 2 亿美元的债务服务费用,截止 2024 年底,其年度利息支出将超过 13 亿美元。
据了解,尽管谈判仍处于初期阶段,但 xAI 目标是未来几个月内筹集资金。知情人士表示,融资规模可能会超过最初的 200 亿美元,具体金额和条款尚未确定。
此外,马斯克旗下脑机接口公司 Neuralink 也被曝计划以 85 亿美元的投前估值筹集约 5 亿美元资金。
知情人士表示,该公司已经开始与潜在投资者就本轮融资进行初步讨论,其中一位知情人士表示,目前预计投后估值为 90 亿美元的条款尚未最终确定,仍可能发生变化。
报道指出,近年来因中美两国关系紧张,而导致不少中国企业的全球化产品在美运营受到了极大影响。而 Manus AI 主要目标市场为美国,因此该公司正计划在海外设立新的总部。据悉,Manus 已考虑将新加坡作为新总部的所在地,并已在当地注册实体,但具体方案尚未确定。
另外,公司创始人还与部分投资人讨论了将国际业务与国内业务完全分离的可能性,计划让 Manus 专注于中国以外的全球市场。
近日,据彭博社报道, Manus AI 完成了一轮融资,由硅谷风司 Benchmark 领投,
据悉,此次融资让 Manus AI 的估值提升至近 5 亿美元(约合 36.44 亿人民币),这一估值比之前的估值增长了约五倍。除了 Benchmark,还有多家现有投资方参与了此轮融资。Manus 背后的初创公司「蝴蝶效应」表示,这笔资金将用于将其服务拓展至美国、日本和中东等海外市场。
据经济学博客 Marginal Revolution 报道,美国社区大学正面临一种全新的欺诈手段: AI 机器人正在大量注册在线课程,以骗取美国联邦和州政府的助学金。
这些 AI 机器人的运作方式十分精妙:它们通过注册课程并保持足够长的注册时间,等到助学金发放后再退课,从中获取资金。
为了维持在校身份,这些机器人会提交由 AI 生成的作业。由于社区大学通常接受所有申请者,因此成为这类欺诈的主要受害者。对此,加州政府成立专门的工作组来应对这一问题。
该事件也引发了人们对 AI 时代身份验证的思考,正如评论区网友指出,针对个人和机构的欺诈攻击正变得越来越复杂,这类问题未来可能只会越来越频繁。
4 月 23 日,腾讯宣布旗下混元 3D 生成模型全新升级,v2.5 新版本在建模精细度上大幅提升,3D 生成迈入超高清时代。
相比前代,混元 3D v2.5 模型架构全面升级,总参数量从 1B 提升至 10B,有效面片数增加超 10 倍,实现超高清的几何细节建模,表面更平整、边缘更锐利、细节更丰富,有效几何分辨率达到 1024,就像从标清升级到了超清画质。
混元 3D 新版本支持 4K 高清纹理和细粒度 bump 凹凸贴图,能够模拟物体表面高低起伏的视觉效果;
混元 3D 在业界率先实现多视图输入生成 PBR 模型,让物体的光影、反射等看起来更接近现实;
混元3D v2.5 优化了骨骼蒙皮系统,支持非标准姿态下的自动骨骼绑定和自动蒙皮权重赋值;
3D 生成工作流功能提供文生/图生 3D 智能减面模型、多视图生 3D 模型等专业管线模板,用户可根据场景选择对应生产管线、灵活调整参数,生成特定风格和特征的 3D 资产。
目前,混元 3D AI 创作引擎全面更新至 v2.5 模型底座,同时免费生成额度翻倍,提升至每天 20 次。混元 3D 生成 API 也已正式上线腾讯云,面向企业和开发者开放。
Adobe 日前在伦敦 MAX 大会上发布了 Firefly 生成式 AI 平台的最新版本,将图像、视频、音频和矢量生成等 AI 工具整合到一个统一平台,并引入多项创新功能。
前者专为快速构思和日常创意需求设计,能高效生成高质量图像;后者则适用于需要更多细节和真实感的项目,在渲染逼真场景、人物肖像方面表现卓越。两款模型均在人物、动物和建筑元素的精度、清晰度和真实感方面有显著提升。
Firefly 视频模型能够生成长达 5 秒的高质量视频内容。用户可通过简单的文本或图像提示创建全新视频,支持多种分辨率和纵横比(包括 16:9、9:16 和全新的 1:1)。该模型在照片级真实感方面比测试版有了显著改进,同时增强了文本渲染、风景和视觉效果。
此外,新版 Firefly 还引入了文本到矢量(Text to Vector)功能,让用户能通过简单文本提示生成完全可编辑的矢量图形,从图标到复杂图案,加速设计工作流程。用户可快速迭代徽标设计、创建独特插图或开发自定义图案。
值得注意的是,Adobe 即将在 iOS 和 Android 平台推出 Firefly 移动应用程序,让用户随时随地创建图像和视频内容。该应用提供专业级创意控件,并与 Creative Cloud 无缝集成,用户可在移动设备上启动项目,之后在桌面上继续工作。
4 月 25 日,Create2025 百度 AI 开发者大会上,百度创始人李彦宏发布了百度文心旗下两大新模型,分别为 ,号称「能力更强、成本更低」。
文心大模型 4.5 Turbo 和 X1 Turbo 都进一步增强了多模态能力。在多个基准测试集中,文心 4.5 Turbo 多模态能力与 GPT 4.1 持平、优于 GPT 4o。而文心大模型 X1 Turbo 基于 4.5 Turbo 的深度思考模型,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强,整体效果领先 DeepSeek R1、V3 最新版。
价格是两款模型最大看点。相比文心 4.5,文心大模型 4.5 Turbo 速度更快,价格下降 80%。文心大模型 X1 Turbo 相比文心 X1,性能提升的同时,价格再降 50%。具体来看:
会上,李彦宏还称百度各业务线都在积极接入 DeepSeek 的模型,但他强调,「DeepSeek 也不是万能的」。李彦宏解释,DeepSeek 目前只能处理文本,还不能理解和生成图片、音频、视频等多媒体内容,幻觉率较高,更大的问题则是慢和贵。他提出,多模态会成为未来基础模型的标配,纯文本模型的市场将会越变越小。
日前,由清华博士曹越创立的 Sand.AI,公布了一款名为「Magi-1」的自回归视频生成模型,其主打两个能力:
无限长度扩展:通过前一段生成的内容进行后一段视频的制作,从而实现跨时间的无缝连贯叙事;
Physics-IQ(对多种物理定律的理解)基准测试:Magi-1 获得 56.02% 的高分成绩,超越可灵 1.6、Sora 等一众模型;
人类评估:与海螺、腾讯混元、通义万相 Wan2.1 相比,Magi-1 在指令跟随和运动质量等方面更具优势,但与可灵 1.6 在视觉质量存在差距;
技术上,Magi-1 整体架构基于 Diffusion Transformer,采用 Flow-Matching 作为训练目标。值得一提的是,据公布的信息显示,Magi-1 通过自回归去噪方式预测固定长度的视频片段,提高了视频生成效率和前后因果性(保证前后内容生成逻辑一致)。
目前,Magi-1 已上架 Sand.AI 官网(可以免费体验!),并且模型权重、代码也进行 100% 开源,技术报告也进行全面公布。
而背后的 Sand.AI 创始人为曹越,其博士毕业于清华大学软件学院,并于 2018 年获清华大学特等奖学金。曹越于 2022 年创办 AGI 公司「光年之外」,后加入智源研究院领导多模态与视觉研究中心。随后在 2023 年,曹越创立了 Sand.AI,并很长一段时间与其他成员保持「隐身」状态。
团队成员方面,有不少与曹越有着类似的历程:智源研究院实习、光年之外创始成员、微软亚洲研究院实习等等。另据了解,San.AI 已完成三轮融资,主要参与方包括今日资本、经纬创投等。
Recall 能够自动截取用户在电脑上的几乎所有活动,创建可检索的时间线,使用户能够轻松找回之前浏览过的内容,而无需记住具体文件名。
这项功能将通过分类快照,让用户可以搜索模糊的记忆,而非依赖精确的文件名。
值得注意的是,Recall 功能原计划于去年 6 月与 Copilot Plus PC 同步推出,但由于安全研究人员提出隐私担忧而多次推迟。微软过去 10 个月对 Recall 的安全性进行了调整,将其设计为完全自愿的选择性功能。
现在,该数据库已实现加密,并默认过滤敏感数据,用户必须主动选择启用才能使用。
除 Recall 外,微软同时升级了 Windows 搜索功能,使其支持自然语言查询,比如用户可以直接搜索「棕色狗」来查找相关图片,而不必知道具体文件名或创建日期。
新推出的 Click to Do 功能则允许用户通过 Windows 键和鼠标左键的组合快速对屏幕上的文字或图像进行操作,包括总结文本或从图像中移除对象等。
根据网友的实测,外媒 TechRadar 发现通过一段提示词,GPT-4o 能够将一些老旧照片转换成修复后的彩色版本,虽然那并未做到真正的「修复」,但效果却颇为惊艳。
比方说,我上传了一张爱因斯坦的经典照片,经过 AI 的「后期」后成功上色。
Bosworth 认为,十年后人们获取内容的方式将发生根本性变化,不再仅限于拿出手机。
「AR(增强现实)眼镜是真正可能实现的,它将为我们提供更自然的交互方式,通过眼睛和耳朵获取信息,不再依赖键盘或触摸屏,」他表示。Meta 的愿景是创造一个「眼镜」能够替代智能手机的世界。
「现在,如果我想播放音乐,首先想到的是『我要用哪个提供商——Spotify 还是 Tidal?』但这不是我真正想要的。我想要的只是播放音乐。」他设想在未来,用户只需表达意图,由 AI 自行决定如何完成任务。
「对我们来说,将基础模型商品化是有利的商业决策。有大量价格具有竞争力或几乎免费的模型有助于整个生态系统发展。它帮助初创公司、学术界,也帮助我们成为平台提供商。」
尽管愿景宏大,Bosworth 也坦承实现「后手机时代」面临多重挑战,包括技术发明风险、社会接受度和生态系统建设。「手机是我们生活的中心。这是作家庭、汽车和工作的方式。世界已经适应了手机。」
微软最新研究报告显示,2025 年将成为「Frontier Firm」(前沿企业)诞生的元年。
「Frontier Firm」的典型特征是围绕按需智能构建,由人类和 AI Agent 组成的「混合」团队支持,能够快速扩展、敏捷运营并加速创造价值。
据调查,82% 的企业领导者认为 2025 年是重新思考战略和运营关键方面的关键一年,81% 的领导者预计在未来 12-18 个月内,AI Agent 将深度整合到公司战略中。24% 的领导者表示其公司已在全组织范围内部署 AI,而仅 12% 的公司仍处于试点阶段。
首先,AI 作为助手消除繁重工作;其次,AI Agent 作为「数字同事」加入团队,在人类指导下承担特定任务;最后,人类为运行整个业务流程的 AI Agent 设定方向,仅在必要时参与。
研究显示,现有的「Frontier Firms」已显示出显著优势:71% 的这类公司员工表示公司蒸蒸日上;55% 能够承担更多工作;90% 报告有机会从事有意义的工作;93% 对未来工作机会持乐观态度,且只有 21% 担心 AI 会抢走工作。
YC 合伙人 Pete Koomen 近日在个人博客中发表文章,指出当前许多流行的 AI 产品设计存在根本性缺陷,他将这些产品比喻为「无马马车」,意指它们仍然遵循传统软件设计思维,未能真正发挥 AI 技术的潜力。
根据 Koomen 的观察,他发现自己更喜欢亲自利用 AI 构建软件,而非使用现有的 AI 应用。
他表示:「当我利用 AI 亲手构建软件时,我可以非常快速地编写出任何我能想象到的功能。AI 给人的感觉就像是一款强大而有趣的工具。而许多已经存在的 AI 应用程序却并非如此。」
Gmail 最近推出了使用 Gemini 模型从零开始生成电子邮件草稿的功能,但 Koomen 指出,这些自动生成的邮件草稿不仅语气与用户个人风格相去甚远,而且通常比用户自己撰写的邮件更加冗长,反而增加了用户的负担。
Koomen 认为问题不在于 AI 模型本身的能力不足,而是应用程序的设计限制了模型的发挥。他指出,当前 AI 应用设计的核心问题在于没有开放系统 Prompt 的编辑权限给用户。
为了证明这一点,Koomen 自己编写了一个简易的 AI 邮件助手,允许用户自定义系统 Prompt。通过这种方式,AI 能够学习用户的写作风格,生成真正符合用户个性的内容。他还展示了自己设计的「Pete 系统提示」,该提示能够让 AI 生成与他个人风格高度一致的邮件草稿。
Koomen 进一步指出,限制当前 AI 应用程序发展的是一种「旧世界思维」。在传统软件模式下,开发者充当人类与计算机之间的中间人,决定软件在一般情况下能做什么,而用户只能提供输入内容。这种框架自然而然地将系统 Prompt 视为开发者的工作,而用户 Prompt 视为用户的工作。
然而,Koomen 认为,在 AI 时代,用户不再需要中间人来告诉计算机该做什么。「当一个 AI 模型代表我行事时,我应该能够通过编辑系统 Prompt 来教它如何模仿我的行为,」他强调,「在大多数 AI 应用程序中,系统 Prompt 应该由用户自己编写和维护,而不是软件开发者。」
「AI 原生软件应该最大化用户在特定领域的效率,」Koomen 总结道。
Anthropic 首席执行官 Dario Amodei 近日发表一篇题为《可解释性的紧迫性》的重要博客,强调当前研究人员对世界领先 AI 模型内部运作机制的了解极为有限,希望到 2027 年能够可靠地检测出大多数 AI 模型问题。
Amodei 指出:「我非常担心在没有更好地理解可解释性的情况下部署这些系统。这些系统将成为经济、技术和国家安全的核心,并且拥有如此高的自主权,人类对其工作原理一无所知是完全不可接受的。」
Amodei 引用 Anthropic 联合创始人 Chris Olah 的观点,认为 AI 模型「更多是生长而非构建的」。换言之,AI 研究人员已经找到了提高 AI 模型智能的方法,但他们并不完全理解其中的原理。
公司发现了追踪 AI 模型思维路径的方法,通过所谓的「电路」。例如,他们识别出一个帮助 AI 模型理解美国城市与州关系的电路。虽然公司目前只发现了少数几个这样的电路,但估计 AI 模型中可能存在数百万个。
从长远来看,Amodei 表示,Anthropic 希望能够对最先进的 AI 模型进行类似「脑部扫描」或「核磁共振」的检查,以识别 AI 模型中的各种问题,包括撒谎的倾向,以及其他弱点。
他认为,这可能需要 5 到 10 年才能实现,但这些措施对于测试和部署未来的 AI 模型至关重要。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
秒没!有人冒高温通宵排队14个小时,溢价已达6.3倍,迪士尼新品遭疯抢
清华659、北大662!一省2025高考提前批投档线山东中考各市高中录取分数线汇总!
AIDA64 发布 7.70 正式版:首次支持 PCIe 7.0,提前支持 Zen 6
领先同行一个时代!海信RGB-Mini LED电视UX评测:光色同控引发画质革命