一起寻找AI时代的生存之道,包括但不限于工作提效,赚钱,就业,娱乐,汇总AI动态和工具资讯,助你跟上科技节奏。

🪐温馨提示:不是所有的都要看,挑感兴趣用得上的看,每个人的口味和需求不一样。

大模型动态

OpenAI推出GPT-4O-Audio-Preview OpenAI展示了GPT-4O-Audio-Preview模型,展现高级语音与情感分析能力。此功能将在客户服务、教育和娱乐领域开创全新互动体验。

详情入口:https://platform.openai.com/docs/guides/audio/quickstart

Anthropic发布Claude 3.5 Sonnet模型 Anthropic推出Claude 3.5 Sonnet,与ChatGPT展开竞争。

复旦发布AI模型Hallo2,生成超长4K人物动画 复旦大学和百度联合开发Hallo2,支持生成超长4K分辨率人物动画,大幅提升动画制作行业创新力。

详情入口:https://fudan-generative-vision.github.io/hallo2/#/

AI产品

特斯拉发布新款Optimus机器人,具备自主导航

特斯拉Optimus机器人展示出自主导航与人类互动能力,技术进步明显,实现了更高效的AI和机器人合作。

苹果Siri计划推出ChatGPT集成与图像生成功能

苹果计划在iOS18、iPadOS18系统中集成ChatGPT功能,为Siri赋予更增强的图像及文本生成能力。

详情入口:https://appleinsider.com/articles/23/xx-new-features

OpenAI推出Windows适用版本ChatGPT客户端

OpenAI发布ChatGPT Windows客户端,处于早期测试阶段,将为更多Windows用户提供便捷使用体验。

精选工具

Perplexity增加内部知识搜索功能

Perplexity新增“内部知识搜索”,提高企业数据检索效率。团队可享有文件共享及AI助手定制功能。

原文链接:https://twitter.com/imxiaohu/status/1847190899744559275

JoyCaption开源视觉语言模型,支持NSFW内容

JoyCaption,支持NSFW内容,研究人员新的实验工具,免费且开源。

技术与学术成果

Google NotebookLM升级AI笔记助手

Google为NotebookLM进行全面升级,增加音频概览和后台功能,为用户带来更佳使用体验。

MIMO实现AI换人保持动作一致性

确保视频中人物一致性的AI换人技术,阿里研究,未完全开源。

详细信息:https://menyifang.github.io/projects/MIMO/index.html

Mini-Omni2: 多模态交互模型支持多输入

Mini-Omni2支持文字、图像、音频输入,处于早期开发阶段,但交互潜力巨大。

末尾广告

觉得有收获,欢迎扫码“言寡意多”,AI资讯和教程推送。

AI工具导航站“未来已来”,AI工具收录。(pc端打开)

https://ainavtool.com/

“GPT,MJ多种AI大模型”扫码优惠购买。

https://nf.video/pLSHs

“精选AI专栏”,优质信息,学AI不孤单。

https://www.xiaobotnav.cn/

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐