AI视野:腾讯云AI绘画上线SaaS版本;SOLAR10.7B大模型屠榜;LG发布全新AI笔记本;麻省理工开源Stream Diffusion
新鲜AI产品点击了解:https://top.aibase.com/
🤖📱💼AI应用
腾讯云AI绘画上线SaaS版本
腾讯云AI绘画推出SaaS版本,成为国内首批通过中国信通院评估的AIGC绘画平台,提供API和在线工具,支持智能图生成、文生成图等多种能力。
【AiBase提要:】
🚀腾讯云AI绘画推出SaaS版本和API两种产品形态,满足不同场景需求,支持智能图生成、文生成图等多项能力。
🌐在中文语境下进行专门优化,展现对中文的深理解和对东方审美的偏好,速度出色,API接口响应时间仅为业内平均水平的一半。
🎨提供在线工具,包括文生成图和图生成图等功能,同时具备作品管理、批量生成和下载等功能,为创意专业人士提供便利。
AI生成视频工具Assistive Video 输入描述即可生成视频
Assistive Video是一款人工智能生成视频工具,用户通过输入描述或上传图片即可轻松生成高质量4秒视频,为各领域带来便捷的视频制作体验。
体验地址:https://top.aibase.com/tool/assistive-video
【AiBase提要:】
🎥 视频生成便捷:Assistive Video通过输入描述或图片,快速生成高清视频,让用户无需专业技能即可轻松创作各类型视频。
🌐 广泛应用领域:该工具有望在广告、影视后期制作、社交媒体内容创作等领域发挥作用,为行业带来革命性改变。
🚀 个性化设置:用户可控制视频质量、一致性、运动强度,甚至设置种子,满足个性化需求,提升用户体验。
Spiritme AI:手机拍5分钟视频即可克隆一个虚拟的你
Spiritme AI是一款类似Heygen的工具,通过使用iPhone拍摄5分钟视频,能够捕捉用户的外貌、动作和表情,实现虚拟形象的克隆,同时支持将文本转换成虚拟形象演说视频。
体验地址:https://top.aibase.com/tool/spiritme-ai
【AiBase提要】
📱 虚拟形象创建: 利用Spiritme AI,只需用iPhone拍摄5分钟视频,即可捕捉外貌和动作,克隆虚拟形象,无需表演经验。
📄 文本到视频转换: Spiritme AI允许用户输入文本,自动生成虚拟形象演说该文本的视频,实现自然的表情展示。
🤖 AI ScriptWriter功能: 支持自动编写视频对话或旁白,根据用户提供的信息,简化视频制作过程,只需两次点击操作。
🤖📈💻💡大模型动态
SOLAR10.7B大模型屠榜HuggingFace
深度学习领域的新技术DUS(深度扩展方法)由Upstage AI提出,成功在SOLAR10.7B大模型上实现创新的羊驼拼接,高效集成,并在HuggingFace排行榜中取得显著成绩。
论文地址:https://arxiv.org/pdf/2312.15166.pdf
【AiBase提要:】
🚀 技术创新: DUS技术通过巧妙选择Mistral7B底材,拼接两个羊驼,并采用层次删除方法,成功超越传统扩展方法,达到令人瞩目的成果。
💡 数据安全与开源: 团队回应数据泄露质疑,提供数据污染测试结果,SOLAR10.7B基础模型和微调模型以Apache2.0协议开源,受到科研社区广泛关注。
👥 用户反馈: 试用者对DUS技术在从JSON格式数据中提取数据的表现表示满意,证明了该技术在实际数据处理上的优越性。
📰🤖📢AI新鲜事
Xbox被指使用AI生成的艺术作品推广游戏
Xbox因在社交媒体上使用由AI生成的艺术作品推广独立游戏而受到指责,引发了关于AI艺术应用的争论,尤其是涉及艺术品的情况。
【AiBase提要:】
🤖 一些玩家指责Xbox在社交媒体上使用AI程序生成的艺术品推广独立游戏,引发了关于AI艺术应用的争议。
📅 Xbox账号在发推询问粉丝对2023年最喜欢的独立游戏的看法时使用了一幅由AI生成的艺术作品,细节异常引发玩家不满,最终Xbox删除了推文。
🖌️ 尽管一些开发者对AI艺术持积极态度,但许多玩家批评其在游戏和广告中的应用,认为引发了社区不满。
LG发布全新AI笔记本
LG公司推出最新LG gram系列笔记本,包括Pro型号16Z90SP和17Z90SP,以及17.16.15和14型号17Z90S、16Z90S、15Z90S和14Z90S。新款支持LG gram Link应用的AI功能,实现屏幕镜像和文件照片分享。
【AiBase提要:】
🌐 LG发布LG gram系列新款笔记本,融合AI功能,支持屏幕镜像和文件分享。
💻 Pro型号搭载Intel处理器、NVMe PCIe4.0SSD和NVIDIA GeForce RTX3050,支持AI Boost。
🔄 LG gram Link构建互联设备生态系统,提升连接性和可扩展性。
奥特曼挖走iPhone设计师 联手打造AI移动设备
苹果设计副总裁Tang Tan加入Jony Ive的LoveFrom公司,与OpenAI合作研发替代智能手机的AI移动设备,计划寻求软银超10亿美元投资。
【AiBase提要:】
🤝 合作计划: Tang Tan离职加入LoveFrom公司,与OpenAI合作研发AI移动设备,计划寻求超10亿美元投资。
📱 产品方向: LoveFrom设计,OpenAI提供软件支持,可能得到软银硬件支持,旨在独立开发避免依赖苹果或谷歌系统。
🚀 背景与动机: Jony Ive与OpenAI合作是在三年协议结束后,意图避免依赖于苹果或谷歌系统,独立开发AI移动设备。
LG开发了一款AI双足机器人
LG最新研发的双足AI机器人将在2024年CES上亮相,可通过摄像头监控和互动宠物,为离家需照顾宠物的人提供便利。
【AiBase提要:】
🤖 智能互动: LG的小型双足AI机器人配备摄像头和人工智能技术,能实时监控宠物行为,用户可远程控制并与宠物进行语音交流。
🐶 照顾解决方案: 机器人为离家需照顾宠物的人提供解决方案,可远程监控宠物状态,提供定制化服务,甚至检测宠物健康状况。
🏠 多功能应用: 除照顾宠物外,机器人还可用于家庭安防、家庭娱乐,是一款多功能智能设备,提供便利和更多与宠物互动的乐趣。
OpenAI员工:未来的关键技能不是提示工程,而是与人类沟通的能力
一位OpenAI员工在社交媒体上表示,未来的关键技能不是提示工程,而是阅读、写作和口语。有效沟通能力将在2024年成为真正重要的技能,即便是对于年薪六位数以上的提示工程师。
【AiBase提要:】
📚 阅读、写作和口语将成为未来最重要的技能。
💬 提示工程与与人沟通并无不同,OpenAI员工表示。
🤖 对话AI系统的关键在于有效沟通技能,而不仅仅是提示工程。
麻省理工用AI发现新抗生素类别
麻省理工大学科学家利用人工智能发现新型抗生素,可对抗耐药性金黄色葡萄球菌(MRSA),是60年来首个重要的抗生素突破。
论文地址:https://www.nature.com/articles/s41586-023-06887-8
【AiBase提要】:
🧠 AI筛选新抗生素: 麻省理工大学用深度学习模型筛选出280种新抗生素候选物,成功对抗MRSA。
🔬 双重方法评估效果: 研究团队结合抗微生物活性预测和毒性评估,找到对细菌有效且对人类安全的化合物。
💡 揭开深度学习“黑箱”: 研究旨在深入了解模型如何学习预测出优质抗生素分子。
👨💻💡🎯聚焦开发者
麻省理工开源Stream Diffusion
该框架采用流批处理去噪和残差无分类器指导方法,实现了流畅、高吞吐量的图像生成。流批式去噪优化了图像生成速度和效率,残差无分类器指导降低了计算成本,同时引入流水线作业和随机相似度过滤提高了系统整体性能。
开源地址:https://github.com/cumulo-autumn/StreamDiffusion
论文地址:https://arxiv.org/abs/2312.12491
【AiBase提要:】
🚀 创新性框架: 东京工业、麻省理工等联合开源的Stream Diffusion框架,8天内获6100颗星,可商用。
⚙️ 流批处理优化: Stream Diffusion采用流批处理去噪,提高图像生成速度和效率,实现了实时交互。
💡 性能提升: 框架引入残差无分类器指导、流水线作业和相似度过滤,超过91FPS的生成帧率,显著降低功耗。
清华大学提出三维重建的新方法O²-Recon
清华大学团队提出O²-Recon方法,通过2D扩散模型和神经隐式表面场,能更准确、完整地重建三维物体,支持大角度旋转和平移,具有广泛应用前景。
论文链接:https://arxiv.org/abs/2308.09591
【AiBase提要:】
👁🗨 O²-Recon利用预训练的扩散模型填补图像遮挡部分,通过神经隐式表面场实现更准确、完整的三维重建。
🔄 O²-Recon支持大角度的旋转和平移,为物体级别的三维表面重建技术带来新突破,具有广泛的应用前景。
🌐 该方法有望在AR/VR/MR、机器人等领域得到应用,为三维重建技术带来新的可能性。
清华新文生3D方法TICD引领SOTA
清华大学刘永进教授课题组的TICD模型在文生3D领域取得显著成绩,通过引入多视角一致性先验,提高了生成的3D模型质量。该模型在T3Bench数据集上的测试表现出色,展现了在单对象、单对象带背景、多对象提示集上的最佳成绩。
论文地址:https://arxiv.org/pdf/2312.11774.pdf
【AiBase提要:】
🚀 创新方法: TICD模型以多视角一致性为先验,通过文本和图像作为条件,纳入NeRF监督信号,有效提高了生成的3D模型一致性和质量。
🌐 全面优势: TICD在T3Bench数据集上通过定性和定量测试,不论是在单对象、单对象带背景还是多对象提示集上均取得最佳成绩,彰显了其整体优势。
🌈 问题解决: TICD方法成功解决了预训练扩散模型的局限性,克服了生成几何结构较差的问题,为文生3D领域带来了新的突破。