多客科技 发表于 2025-6-5 21:24

AI行业《晚间资讯》2025-6-5

作者:微信文章

本篇有7020字,可听全文。进AI社群,加VX:szbrds


AI重塑视频后期,创意无限重塑

Luma Labs 推出了一款名为 Modify Video 的新视频编辑工具,利用人工智能技术让视频后期制作变得简单又高效。这个工具可以让用户上传视频后,通过文本提示来改变视频风格、场景和角色,甚至不需要重新拍摄就能实现个性化编辑。它基于强大的 Ray2 模型,能生成高质量、动作流畅的视频,适合各种创作者和影视制作人使用。Modify Video 的出现降低了视频制作的门槛,让更多人能低成本、高效率地创作出高质量的视频内容。

亚马逊北卡百亿投资,AI云基建助力经济腾飞

亚马逊计划在北卡罗来纳州砸下100亿美元,扩建数据中心,支持人工智能和云计算技术。这个大动作不仅会给当地带来至少500个高技能工作,还能间接创造数千个岗位,推动当地科技行业和经济发展。简单来说,亚马逊这笔投资就像给北卡罗来纳州科技未来装上了加速器。

谷歌Gemini2.5升级,AI对话更自然

谷歌推出了Gemini2.5 AI系统,这个新版本可以让AI和人类用音频进行更自然的对话。它不仅支持文本、图像和视频,还能理解和生成音频和代码,让交流更流畅。Gemini2.5能模仿人的语调、口音,还能理解笑声等非语言声音,用户甚至可以用耳语和它交流。这个系统还能根据用户的提示调整对话风格,自动获取信息,理解对话上下文,支持多种语言,还能感知情感,进行高级思维对话。此外,它的文本转语音技术也很先进,用户可以控制语音的风格、情感和速度。谷歌还为这个系统加入了水印技术,确保生成内容的透明性。开发者可以利用这个系统,通过Google AI Studio或Vertex AI的API,开发出更多互动性强的应用。

Athena AI助手指引开发,加速创新与交付

微软推出了一款名叫Athena的人工智能助手,它能在Teams应用里帮忙处理一些重复的编程工作,比如代码审查和任务管理,这样开发人员就能更专心搞创新。Athena的源代码已经开源,大家都可以在GitHub上自由修改和使用。这个AI助手已经在微软内部用了一段时间,提高了工作效率,还帮着提前发现了一些安全问题,让产品更安全可靠。总的来说,Athena就是帮助开发团队更快更好地完成产品开发。

AI安全成焦点,Anthropic人才涌动

Anthropic这家初创公司正在AI领域大放异彩,吸引了大量顶尖人才,包括从OpenAI和谷歌DeepMind跳槽过来的专家。他们之所以纷纷加入,是因为Anthropic不仅技术实力强,还特别重视AI安全。这家公司成立时间不长,但未来发展潜力巨大,员工留任率高达80%,远超其他公司。他们还推出了受欢迎的AI助手Claude,并提供吸引人的股权激励,这让工程师们更愿意加入。简而言之,Anthropic凭借其独特优势,正在AI行业竞争中崭露头角。

《逆水寒》推图生动图,轻松创作个性化动图

《逆水寒》手游新推出“图生动图”功能,让玩家轻松把静态图片变成动图,增加游戏乐趣。玩家可以在游戏内选择图片,输入效果描述,系统就会生成动图。还能设置不同品质和时长,甚至加入特效和提示词,让图片更生动。不过,这个功能是付费的,费用根据动图品质和时长来定。玩家还能和游戏里的伙伴一起创作亲密场景的动图。

Jaaz:简化AI图像生成,赋能创意设计

Jaaz是一款新推出的开源AI设计工具,它能够帮助创作者和团队自动化生成大量图像,简化创意生产流程。用户只需配置相应的API,就能轻松生成所需图像。虽然Jaaz目前支持的API有限,但它开源的特性让开发者可以不断优化和扩展功能。未来,Jaaz有望成为一个支持多种图像和视频生成API的全能型创意平台,满足专业创作者的各种需求。对于想要提高设计效率的人来说,Jaaz值得一试。项目详情和源码可在GitHub上查看。

NVIDIA发布Llama-3.1,多模态AI新突破

NVIDIA推出了一款名为Llama-3.1-Nemotron-Nano-VL-8B-V1的新型AI模型,这个模型厉害的地方在于它能够处理图像、视频和文本,然后输出高质量的文本内容。简单来说,这个模型可以帮助开发者轻松处理文档、图像和视频,生成结构化的信息,特别适合用在教育、法律、金融等行业。NVIDIA的这个新模型不仅性能强大,还开源了,让全球的开发者都能免费使用,这也为那些资源有限的开发者和小企业提供了更多机会。

AI用户激增,资本投入加速

最新报告显示,人工智能的使用和投资都在飞速增长。比如,ChatGPT这个AI聊天机器人的用户在17个月内增加了8倍,达到8亿人,比历史上任何产品吸引用户都快。而且,ChatGPT在全球范围内都很受欢迎,特别是在印度和美国。同时,大科技公司对AI的投资也在增加,过去十年增长了21%,去年更是猛增63%,达到2120亿美元。这表明企业相信AI能带来增长,并在市场竞争中保持优势。微软的高管甚至把AI和云计算比作新时代的电力,认为它们将引领下一轮工业革命。

AI训练成本飙升,推理成本骤降,重塑商业格局

知名投资人Mary Meeker的最新报告指出,AI行业正面临一个关键矛盾:模型训练成本飙升到百亿美元级别,而推理成本却因硬件和算法进步下降了99%。这种成本分化让AI行业变成了资本密集型的竞赛,只有少数大公司能参与。报告还提到,AI公司要在烧钱和技术壁垒之间找到平衡,并形成网络效应以实现可持续盈利。AI行业将迎来大洗牌,形成少数模型提供商和众多应用创新公司的“哑铃型”结构。

AI革命,机遇与挑战并存

"互联网女皇" Mary Meeker 发布了最新的 AI 趋势报告,指出人工智能正在飞速发展,比如 ChatGPT 仅用17个月就吸引了8亿月活跃用户。科技大公司正在大量投资 AI,预计2024年相关支出将增长63%。但这也意味着一些传统工作可能会被 AI 取代,大家需要学习新技能来适应。简单说,AI 正在改变我们的生活,带来新机会,也带来挑战。

AI革命速度远超预期,开发者生态成竞争核心

Mary Meeker 发布了一份长达340页的AI趋势报告,指出人工智能的发展速度史无前例,远超以往任何技术革命。报告显示,AI用户增长、技术迭代和资本投入都在飞速上升,比如ChatGPT的用户数在17个月内激增到8亿。同时,开发者成为AI竞赛的关键,领先芯片制造商的开发者数量指数级增长。Meeker警告,AI对就业和社会的影响不可逆转,这是一个既有机遇也有挑战的时代,只有适应变革的人才能立足未来。总结来说,AI技术发展迅猛,影响深远,竞争激烈,适应者将受益。

Bland AI TTS引擎突破“恐怖谷”,语音克隆与情感化交互革新。

AI语音技术取得重大进展,Bland AI公司推出了一款名为Bland TTS的语音合成引擎,它能通过一段短音频克隆任意人声,并支持不同语音风格的混合,还能根据文本内容自动调整语气和情感,让语音听起来更自然。这项技术不仅降低了语音合成的难度,还能生成音效,为游戏、影视和虚拟现实等领域带来更沉浸的体验。Bland TTS的问世,为智能客服、内容创作、虚拟助手等多个行业带来了新机遇,有望成为语音AI领域的新标杆。

Suno升级AI音乐工具,版权争议持续。

Suno这个人工智能音乐创作平台最近对其音乐编辑工具进行了大升级,让用户可以上传未完成的音乐作品进行混音和编辑。同时,唱片公司比如索尼、环球和华纳正在和Suno商量版权问题,想要用YouTube的Content ID技术来追踪AI平台上音乐的使用情况,确保版权所有者能从中获利。尽管Suno和竞争对手Udio面临版权诉讼,但Suno还是在2024年春季成功融资1.25亿美元,估值达到了5亿美元。

ChatGPT连接多服务,企业应用更强大

人工智能助手ChatGPT现在能连接更多外部服务了,比如Microsoft Outlook、Google Drive等,这让它在商业领域的应用更强大。企业用户可以用它更高效地协作和获取信息,IT管理员还能自定义连接器,整合公司内部系统。另外,macOS版的ChatGPT还新增了“录制模式”,能自动生成会议记录和摘要。这些新功能先给企业客户用,然后慢慢对所有用户开放。虽然ChatGPT进步了,但还得面对微软等竞争对手的挑战。总之,这些更新让企业在信息化时代更有竞争力。

英伟达董事抛售股票,股价回升引关注

英伟达公司董事马克・史蒂文斯最近卖掉了超过一百万股公司股票,这笔交易差不多值1.5亿美元。这事儿发生在英伟达股票价格回升之后,大家都在猜他为什么要卖股票。史蒂文斯是亿万富翁,他的决定对市场影响挺大。虽然英伟达的芯片在市场上很受欢迎,但这笔交易还是让人们对公司未来有点不确定。简单来说,史蒂文斯卖股票可能是因为个人财务规划,但这也让投资者们得关注英伟达接下来的表现。

TPG助力马斯克xAI融资,AI技术再突破

大消息!埃隆·马斯克的人工智能公司xAI得到了大投资,TPG Angelo Gordon成了主要金主,给他们提供了一笔贷款,帮助xAI在人工智能领域大步前进。这笔钱将用来研发新技术、扩大团队和推广市场。TPG的加入也让xAI更受信任,未来发展前景一片光明。咱们拭目以待,看看xAI能在人工智能界搞出啥大动作!

Firecrawl API简化AI数据抓取

Firecrawl新推出的/search API让AI开发者获取网页数据变得更简单,只需一次API调用就能完成搜索和内容抓取,输出的数据格式还特别适合AI使用。这个工具不仅提高了数据收集效率,还降低了技术门槛,让开发者无需复杂操作就能获取高质量数据,对智能代理、内容分析和市场研究等AI应用场景非常有帮助。Firecrawl作为开源工具,还得到了全球开发者的支持,提供了多种语言的SDK和详细文档,让开发者更容易上手。

腾讯公益AI问询,互动透明促公益

腾讯公益推出了“问AI”功能,让大家能通过简单提问了解公益项目和机构,提高了互动和透明度。这个新功能让获取公益信息更方便,也让更多人能参与公益活动。腾讯还与清华大学合作,用AI技术帮助乡村小学的学生。腾讯的这些做法不仅让公益项目更容易被看到,也在用AI技术为公益创新开辟新道路,鼓励更多人参与公益活动。

“今天学点啥”上线PPT导出,限时免费体验

秘塔AI搜索的“今天学点啥”平台,响应用户需求,新推出了PPT导出功能,方便用户整理和分享学习资料。用户现在可以轻松导出视频讲解的PPT,包括图文、语音和逐字稿。但要注意,这个功能挺费资源的,所以平台决定6月5日至7日免费试用三天,之后每次使用要消耗1400点计算额度,但注册用户会送5000点额度。

亚马逊北卡投资百亿,拓展云AI中心,促就业。

亚马逊要在北卡罗来纳州砸100亿美元建大数据中心,这个大动作不仅能给当地带来至少500个高技能工作,还能让供应链上的几千个工作岗位受益。这个数据中心是为了加强云计算和人工智能的技术支持,将来还会吸引一大波技术人才,给北卡罗来纳州的科技行业带来新机遇,同时也让亚马逊在云计算和人工智能领域的领先地位更稳固。简单来说,这笔投资既强大了亚马逊,也带火了当地经济。

Wordsmith AI融资2500万,助律师变法律工程师

苏格兰的法律科技公司Wordsmith AI Ltd.最近获得了2500万美元的投资,他们要用这个钱让律师们变得更像工程师,用人工智能来帮忙审查合同和政策文件。这个平台能自动标注文件中的问题,还能和常用的办公软件一起用。公司的老板以前是律师,后来变成了软件工程师,他认为这样做能让律师们有更大的影响力。现在,一些大公司已经在用他们的服务了,Wordsmith计划用这笔钱扩展业务,还打算开个学院来培训更多人。简单说,Wordsmith想要用AI技术改变法律行业,让律师们的工作更高效。

亚马逊推人形机器人,自动化配送革新物流

亚马逊正在研发一款人形机器人软件,目的是让配送工作自动化,提高送货效率,同时减少人力成本。将来,这些机器人可能会在社区里给咱们送包裹,这可是要改变现在快递员送货的传统方式哦!简单来说,就是以后可能会有机器人代替快递员,让包裹更快更方便地送到我们手中。

Midjourney视频功能上线,AI图像生成再升级

Midjourney即将推出视频生成功能,本月上线,并计划举办评级派对让用户参与优化。新功能将注重动态效果和视觉美感,初期仅对年度订阅用户开放。同时,Midjourney正在扩容服务器、升级风格引用功能,并加速研发V7.1和V8模型,预计V8将带来重大创新。这些更新将让Midjourney在AI图像和视频生成领域继续保持领先,为创作者提供更多创意工具。感兴趣的用户可以关注官网动态,参与体验新功能。

蚂蚁AIaaS平台助力金融科技AI化

蚂蚁国际推出了一个新平台,叫Alipay+ GenAI Cockpit,它是一个人工智能服务(AIaaS)平台,专门为金融科技公司提供支持。这个平台能自动处理支付、客户服务、合规检查等金融关键流程,帮助金融机构更智能、更高效地工作。它基于大型语言模型,已经在蚂蚁国际内部测试过,并计划2025年开始向外部客户提供服务。简单来说,这个平台就是用AI技术帮助金融行业更智能地处理各种业务。

AI入厨引争议

厨师Grant Achatz在芝加哥的米其林星级餐厅Next使用AI助手ChatGPT设计菜谱,引发了关于AI在创意烹饪中角色的热议。起因是一家名为Ethos的虚拟餐厅在Instagram上走红,展示了AI生成的奇特菜品。餐饮业者开始广泛应用AI技术,但Achatz的决策引起了争议,有人认为这是对真正厨师创造力的侮辱。AI生成的食谱还可能存在安全隐患,因为它们可能缺乏常识和烹饪经验。这场争议触及了AI在创意行业中的角色,以及技术与传统工艺之间的平衡问题。简而言之,AI在餐饮业的应用引发了关于创意、安全与传统的讨论。

Shisa V2405B:日本最强开源模型,日语AI新突破

Shisa.AI最近推出了一款名为Shisa V2405B的日英双语开源模型,被誉为日本有史以来最强的语言模型。这个模型在日语任务上表现出色,甚至超过了GPT-4等知名模型,同时保留了强大的英语处理能力。Shisa V2系列模型覆盖了不同规模,适用于各种设备,为日语AI应用带来了新可能性,并通过开源方式推动了全球AI创新。这对于需要处理复杂日语任务的开发者来说,是一个值得关注的工具。

美商务部更名聚焦AI安全与标准

美国商务部的人工智能安全研究所改名了,现在叫人工智能标准与创新中心(CAISI)。这个中心不再只是关注安全,而是更着重于保护国家安全和减少国际上不必要的规矩。商务部长霍华德・卢特尼克说,这样做的目的是为了加强美国的创新能力,还要确保美国在制定全球人工智能规矩时能起到领导作用。这个中心之前已经和一些大的人工智能公司合作,比如OpenAI,一起研究怎么降低人工智能带来的风险。另外,特朗普政府现在正在推动人工智能的发展,取消了一些之前限制人工智能发展的规定,还打算让更多学校用上这种技术,甚至用煤炭来供电给那些耗电量大的人工智能中心。他们还提出了一个计划,未来10年里不让各州对人工智能进行监管。

英伟达发布高效文档处理AI模型

英伟达推出了一款名为Llama Nemotron Nano VL的新型文档处理模型,它小巧高效,能在云端到边缘设备上处理复杂的文档和图表。这个模型在OCRBench v2基准测试中排名第一,特别擅长理解和解析文档内容,包括表格和图表。它不仅节省成本,还能灵活部署,适用于各种企业场景,如财务、医疗和法律领域。英伟达的这个新模型有望推动自动化文档处理和智能协作的发展。

ChatGPT升级,企业协作更高效

OpenAI更新了ChatGPT,加入了两个新功能:支持Model Context Protocol(MCP)和会议记录模式。MCP让ChatGPT能和企业内部数据如GitHub、Dropbox等无缝连接,帮助企业快速查询和分析信息。会议记录模式则能自动转录会议内容,提取关键信息,提高团队协作效率。这些更新让ChatGPT在企业应用中更加强大,有助于提升工作效率和数据利用率。未来,OpenAI还计划推出更多企业定制功能。

AI公司违规访问Reddit,版权纠纷再起

Reddit 把一家AI公司Anthropic告上了法庭,因为这家公司违反了Reddit的规定,偷偷访问了平台超过10万次。Reddit说,Anthropic表面上装作是AI行业的守护者,但实际上没遵守规则。Reddit的法律负责人表示,Anthropic这样利用Reddit的内容,可能会让他们赚很多钱。Reddit之前跟谷歌也签了协议,允许他们用平台数据来训练AI,这也显示了Reddit内容的重要性。不过,Anthropic之前也因为版权问题被起诉过。这个事情让大家开始思考,AI技术发展这么快,我们怎么在保护版权和推动创新之间找到平衡。

Reddit诉Anthropic:AI数据抓取争议引法律诉讼

Reddit把人工智能公司Anthropic告上了旧金山高等法院,因为他们没经过允许,就用了Reddit上的帖子来训练他们的人工智能模型Claude。Reddit说Anthropic违反了他们的用户协议和商业规定。这个案件让AI公司获取训练数据的合法性成了热点话题。Reddit要求Anthropic删除所有用Reddit内容训练的AI模型和数据,还禁止他们用这些数据来赚钱。这个案件可能会影响整个AI行业,因为如果Reddit赢了,其他公司也可能跟着告AI公司,那样AI公司获取数据的方式可能就要改变了。

ChatGPT用户突破300万,AI商业应用广受欢迎

OpenAI最近宣布,他们的付费ChatGPT商业订阅用户已经超过300万,这个数字在短短四个月内增加了100万,显示出人工智能在商业中的巨大吸引力。自从去年推出ChatGPT Enterprise以来,OpenAI推出了多款商业产品,如ChatGPT Team和ChatGPT Edu,为企业用户提供了更多选择。这些产品帮助企业提升效率,推动了行业的数字化转型。OpenAI的成功不仅自身发展迅速,也为其他企业提供了数字化转型的参考。随着AI技术的普及,未来它将更深入地融入我们的工作和生活。

Mistral AI发布企业编码助手,挑战微软GitHub Co pilot市场

法国人工智能公司Mistral AI推出了一款名为Mistral Code的企业编码助手,它能在企业自己的服务器上运行,保护专有代码安全。这款产品结合了最新的AI模型和开发环境插件,特别为大型企业设计,提供深度定制和本地部署选项。Mistral Code解决了企业采用AI编码助手时遇到的四大障碍,如与专有存储库的连接、模型定制能力、工作流任务覆盖和跨供应商服务协议问题。此外,Mistral还从Meta羊驼AI团队挖来了多名关键研究人员,增强了公司的技术实力。Mistral Code的开源优势使其在市场上具有竞争力,尤其重视数据隐私和欧洲监管合规。

Cursor1.0:AI赋能,编程更高效

Cursor 1.0版本正式发布,这个基于AI的代码编辑器为开发者带来了更智能的编程体验。它的新功能BugBot能自动审查代码并修复错误,Background Agent让远程编码更智能,还支持Jupyter Notebook,方便数据科学家工作。Cursor 1.0还优化了界面,简化了环境配置,让开发更高效。这款编辑器的发布预示着AI在开发领域的应用越来越深入,而且Cursor背后的公司Anysphere获得了大量融资,未来发展值得期待。开发者可以从Cursor官网下载最新版本。

ChatGPT新功能助职场效率翻倍

OpenAI最近给ChatGPT加了两个新功能,叫“连接器”和“记录模式”,让这个AI助手能更好地帮企业干活。简单说,“连接器”能让ChatGPT跟企业常用的工具,比如GitHub、Google Drive等,轻松对接,帮你快速找到需要的信息。而“记录模式”则能在会议中自动录音、转写和总结,让你不用忙于记笔记,更专心开会。OpenAI还强调了数据安全,确保企业信息不外泄。这些更新让ChatGPT成了职场人士的得力助手,提高了工作效率。
页: [1]
查看完整版本: AI行业《晚间资讯》2025-6-5