谷歌团队提出一个设想,用AI技术处理用户照片及搜索引擎查询信息,全面分析出用户的生活是怎样的,这个项目名叫“Project Ellmann”。
按照最初的设想,Project Ellmann会用LLM(比如Gemini)提取信息,从用户的照片中找到特定模式,然后制作一个聊天机器人,让它精准回答问题。谷歌宣称Ellmann将会成为“个人生活故事讲述者”。
听起来很有趣,不过谷歌到底是想将Ellmann功能植入谷歌Photos,还是放进其它产品?目前还不得而知。谷歌Photos拥有10多亿用户,存储了4万亿张照片或者视频。
谷歌目前正在利用AI技术来优化其产品线,Ellmann只是其中一种利用方式。几天前,谷歌推出了Gemini,在某些情况下,Gemini甚至已经超过了OpenAI GPT-4
谷歌有意将Gemini授权给谷歌云(Google Cloud)用户使用,用户可以借助Gemini开发自己想要的功能。Gemini最突出的优势在于“多模态”,也就是说它可以理解文本、图片、视频、音频等多种类型的信息。
在最近的一次内部会议上,谷歌Photos部门一位高管展示了Project Ellman。内部文档显示,谷歌团队认为可以借助大语言模型以“鸟瞰”方式展示用户在现实世界的生活故事。
通过阅读传记、之前的记录和照片等资料,Ellman能够更加深入地理解情境。举例来说,通过分析一系列片段,Ellman可以确定这些信息是否涉及大学生活的主题
在演示幻灯片中有一句话写道:“如果不能从鸟瞰的角度来审视个人生活,我们就无法解决难题,也无法讲好故事。”
另一个张则提到:“我们会查看您的照片,查看其标签和位置,然后确定它们是否属于某个有意义的时刻。当我们全面了解您的生活时,您的个人故事将变得更加清晰。”
谷歌团队还谈到了Ellmann Chat。什么是Ellmann Chat?团队描述说:“你不妨设想一下,当你打开它,它已经知道与个人生活有关的一切,你会向它提什么问题呢?”
例如,用户问Ellmann Chat一个问题:“我有没有养狗。”AI回答说主人有一只狗,还说出了狗的名字,还说家里有两个人最喜欢和狗在一起,家人的名字叫什么。
另一个问题则是主人想搬家,让AI提供一些与现有居住环境相似的小镇供选择。这些问题Ellmann都能回答。不只如此,Ellmann还知道用户的饮食习惯是怎样的。
举个例子,当用户想要购买某样东西、对什么感兴趣、有什么工作和旅行计划时,Ellmann可以通过分析照片来找到答案。而用户喜欢访问哪些网站、使用哪些App,Ellmann也能了如指掌
谷歌新闻发言人透露:“谷歌照片一直希望利用人工智能技术来帮助用户搜索照片和视频。有了LLM,我们能够提供更实用的体验。目前,Ellmann仍处于内部早期探索阶段,是否最终推出还需要时间来确定。谷歌要确保Ellmann对用户真正有帮助,同时也要考虑用户的隐私和安全。”
有很多科技企业都想利用新技术为用户创建更加个性化的个人记忆,Project Ellmann只是其中之一。
不管是谷歌Photos还是苹果相册,它们都在分析照片,从中找到规律,然后制作相册。谷歌Photos可以自动将相似照片集合在一起变成相册,方便用户查找。苹果6月份曾说,软件升级之后可以识别相片中的人、狗或者猫,用户只需要说出人的名字,软件就可以帮你查找他的照片。
听起来很不错,可是谷歌和苹果的技术仍然存在不完美的地方,有时候也会出现错误。在2015年,苹果和谷歌的人工智能曾经将黑人错误地识别为黑猩猩,这个错误引起了很多的笑话。即使到了现在,这种错误仍然难以避免
以上是为Gemini AI大模型找场景 谷歌Project Ellman项目曝光的详细内容。更多信息请关注PHP中文网其他相关文章!

经常使用“ AI-Ready劳动力”一词,但是在供应链行业中确实意味着什么? 供应链管理协会(ASCM)首席执行官安倍·埃什肯纳齐(Abe Eshkenazi)表示,它表示能够评论家的专业人员

分散的AI革命正在悄悄地获得动力。 本周五在德克萨斯州奥斯汀,Bittensor最终游戏峰会标志着一个关键的时刻,将分散的AI(DEAI)从理论转变为实际应用。 与闪闪发光的广告不同

企业AI面临数据集成挑战 企业AI的应用面临一项重大挑战:构建能够通过持续学习业务数据来保持准确性和实用性的系统。NeMo微服务通过创建Nvidia所描述的“数据飞轮”来解决这个问题,允许AI系统通过持续接触企业信息和用户互动来保持相关性。 这个新推出的工具包包含五个关键微服务: NeMo Customizer 处理大型语言模型的微调,具有更高的训练吞吐量。 NeMo Evaluator 提供针对自定义基准的AI模型简化评估。 NeMo Guardrails 实施安全控制,以保持合规性和适当的

AI:艺术与设计的未来画卷 人工智能(AI)正以前所未有的方式改变艺术与设计领域,其影响已不仅限于业余爱好者,更深刻地波及专业人士。AI生成的艺术作品和设计方案正在迅速取代传统的素材图片和许多交易性设计活动中的设计师,例如广告、社交媒体图片生成和网页设计。 然而,专业艺术家和设计师也发现AI的实用价值。他们将AI作为辅助工具,探索新的美学可能性,融合不同的风格,创造新颖的视觉效果。AI帮助艺术家和设计师自动化重复性任务,提出不同的设计元素并提供创意输入。 AI支持风格迁移,即将一种图像的风格应用

Zoom最初以其视频会议平台而闻名,它通过创新使用Agentic AI来引领工作场所革命。 最近与Zoom的CTO XD黄的对话揭示了该公司雄心勃勃的愿景。 定义代理AI 黄d

AI会彻底改变教育吗? 这个问题是促使教育者和利益相关者的认真反思。 AI融入教育既提出了机遇和挑战。 正如科技Edvocate的马修·林奇(Matthew Lynch)所指出的那样

美国科学研究和技术发展或将面临挑战,这或许是由于预算削减导致的。据《自然》杂志报道,2025年1月至3月期间,美国科学家申请海外工作的数量比2024年同期增加了32%。此前一项民意调查显示,75%的受访研究人员正在考虑前往欧洲和加拿大寻找工作。 过去几个月,数百项NIH和NSF的拨款被终止,NIH今年的新拨款减少了约23亿美元,下降幅度接近三分之一。泄露的预算提案显示,特朗普政府正在考虑大幅削减科学机构的预算,削减幅度可能高达50%。 基础研究领域的动荡也影响了美国的一大优势:吸引海外人才。35

Openai推出了强大的GPT-4.1系列:一个专为现实世界应用设计的三种高级语言模型家族。 这种巨大的飞跃提供了更快的响应时间,增强的理解和大幅降低了成本


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

SublimeText3汉化版
中文版,非常好用

记事本++7.3.1
好用且免费的代码编辑器

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。