关于人工智能:马斯克称首位受试者可凭思维操控鼠标字节低调推出视频模型丨-RTE-开发者日报-Vol148

7次阅读

共计 2856 个字符,预计需要花费 8 分钟才能阅读完成。

开发者敌人们大家好:

这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。咱们的社区编辑团队会整顿分享 RTE(Real Time Engagement)畛域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议」,但内容仅代表编辑的个人观点,欢送大家留言、跟帖、探讨。

本期编辑:@CY

01 有话题的新闻

1、马斯克示意第一位 Neuralink 患者能够通过思维管制电脑鼠标

2 月 20 日音讯,伊隆·马斯克在社交媒体平台 X 上的 Spaces 流动中走漏,脑机接口公司 Neuralink 的首位人类受试者「仿佛已齐全痊愈,并能仅凭思维在电脑屏幕上挪动鼠标」。

Neuralink 是这位亿万富翁的初创公司,该公司示意已开发出一种大脑植入物,旨在帮忙人类利用神经信号来管制内部技术。该公司的指标是复原视力、静止性能和语言等丢失的能力。

据一篇博客文章称,Neuralink 在 5 月份取得美国食品和药物管理局批准发展这项钻研后,于秋季开始招募患者进行首次人体临床试验。此次人体临床试验标记着 Neuralink 在商业化路线上迈出了一步。医疗器械公司必须通过多轮密集的数据安全收集和测试,能力取得 FDA 的最终批准。(@CNBC)

2、字节跳动低调推出视频模型 Boximator,尚无奈作为欠缺产品落地

2 月 20 日音讯,在 OpenAI 公布 Sora 之前,字节跳动低调推出了一款视频模型产品 Boximator。Boximator 能够通过文本管制生成视频中人物或物体的动作。

对此,字节跳动相干人士回应称,Boximator 是视频生成畛域管制对象静止的技术办法钻研我的项目,目前还无奈作为欠缺的产品落地,间隔国外当先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

字节跳动从去年开始布局 AI,并于去年 11 月成立专一于 AI 翻新业务的新部门 Flow。一位靠近字节跳动的知情人士对界面新闻示意,去年一年,字节跳动创始人张一鸣的全副工夫都花在 AI 上了,从其精力调配上也能够看到字节跳动对 AI 业务的器重水平。(@界面新闻)

3、苹果 AirPods 团队大洗牌:Gary Geaves 卸任,苹果 AirPods 团队换帅

依据外媒报道,长期负责声学副总裁的 Gary Geaves 到职,苹果 AirPods 产品线迎来新的掌舵者 Ruchir Davé。古尔曼在推文中示意应用了“shuffles”(洗牌)来形容,表明苹果公司的音频产品团队管理层呈现了较大规模的调整。

据理解,苹果公司的声学小组领有约 300 名成员,为 AirPods、HomePods 和其余苹果设施开发音频技术。该团队负责创立空间音频,即 AirPods、Vision Pro 和其余设施内置的 3D 音效性能。据去年 12 月报道,当月苹果产品设计副总裁 Tang Tan 到职,而他还负责监督配件设计和开发 AirPods 的声学团队,因而他的到职牵动了苹果硬件业务的连锁反应。(@IT 之家)

4、传言称苹果 Vision Pro 次要人员已被调往可折叠 iPhone 开发团队工作

2 月 20 日音讯,早前有传言称,苹果曾经进行了可折叠 iPhone 的研发工作,因为显示屏的耐用性存在问题。当初,有最新消息称,这家科技巨头仍然正在踊跃开发这款设施,而且实际上曾经从新指派了苹果 Vision Pro 团队的一些要害人员来开发这种新的形状。

一位靠近苹果外部打算的人士向 Alpha Biz 走漏,该公司正在踊跃致力推出可折叠 iPhone。这位不愿走漏姓名的人士还提供了该产品的预计上市时间表,同时提到苹果 Vision Pro 的次要成员已被指定参加该设施的开发。

「据我所知,大量 Vision Pro 外围人员曾经被调往可折叠手机开发团队,用于开发可折叠手机。除非情况有变,否则苹果可折叠手机将于 2026 年 9 月开始销售。」(@cnBeta)

5、谷歌 Gemini Advanced 更新,可间接在线编辑和运行 Python 代码

2 月 20 日音讯,依据谷歌官网更新布告,Gemini Advanced 订阅用户可间接在 Gemini 界面中编辑和运行 Python 代码,从而帮忙开发者疾速验证试验代码,确保代码可预期运行,而且能够立刻查看代码批改后的后果。

谷歌于 2 月 8 日发表将 Bard AI 聊天机器人更名为 Gemini,并推出专门的安卓 App,其中搭载 Gemini Ultra 1.0 模型的版本须要注册 Gemini Advanced 订阅,其在逻辑推理、执行指令、编程和创意合作等方面更胜一筹。此次新性能目前仅实用于 Gemini Advanced 高级用户,Gemini 收费版本不可用。

依据谷歌的说法,这项性能可次要用于以下两方面:一是学习,有志于成为程序员的人能够应用 Gemini 试验代码片段,察看批改的影响,并更深刻地了解编码原理。二是验证,开发人员能够应用 Gemini 疾速验证 AI 生成的 Python 代码的性能,而后再将其集成到他们的我的项目中。(@IT 之家)

6、微软公布 Visual Studio 2022 17.10 首个预览版更新:改良 GitHub Copilot、主动装置举荐组件

据微软官网新闻稿,微软目前公布了 Visual Studio 2022 17.10 首个预览版本,该版本号称重点改良了 GitHub Copilot,并对设置、扩大组件等方面进行了一系列更新。微软声称,GitHub Copilot 在 Visual Studio 2022 17.10 中从“聊天机器人”降级到了“开发搭档”,在该版本中,Copilot 可能“更好地从我的项目中收集信息”,进一步为开发者以后的开发环境提供更有意义的答案,同时开发者还可能间接在我的项目中与 Copilot 互动并获取倡议,并“轻松获取生成式 AI 利用开发倡议”。(@CSDN)

02 有态度的观点

1、周鸿祎回应 AI 十大预言:已实现 4 个

2 月 20 日,在承受采访时被问到当初怎么看年初提出的 AI 十大预言时,周鸿祎回应称曾经实现 4 个了。别离是开源大模型暴发、大模型运行在终端、文生图和文生视频获得突破性停顿、多模态成为大模型标配。周鸿祎认为,特地是 Sora 的呈现让他感到很意外,倒退得很快。

十大预测别离是:大模型无处不在,成为数字零碎标配;开源大模型暴发;” 小模型 ” 涌现,运行在更多终端;大模型企业级市场崛起,向产业化、垂直化方向倒退;Agent 智能体激发大模型潜能,成为超级生产力工具;2024 年是大模型利用场景之年,To C 呈现杀手级利用;多模态成为大模型标配;文生图、文生视频等 AIGC 性能突破性增长;具身智能赋能人形机器人产业蓬勃发展;大模型推动基础科学获得冲破。(@中国企业家杂志)

写在最初:

咱们欢送更多的小伙伴参加「RTE 开发者日报」内容的共创,感兴趣的敌人请通过开发者社区或公众号留言分割,记得报暗号「共创」。

对于任何反馈(包含但不限于内容上、模式上)咱们不胜感激、并有小惊喜回馈,例如你心愿从日报中看到哪些内容;本人举荐的信源、话题、流动等;或者列举几个你喜爱看、平时常看的内容渠道;内容排版或出现模式上有哪些能够改良的中央等。

素材起源官网媒体 / 网络新闻

正文完
 0