vwin德赢中国_www.vwinchina.com_德赢vwin中国官网建筑是一家中日合资企业.本公司有着多年业界高端设计经验,专业提供成都景观设计和四川园林设计!
当前位置: 主页 > 行业知识 > 行业知识 >
行业知识/KNOWLEDGE

人工智能下个挑战教会机器理解图像和动作行

发布时间:2017-02-07 16:26   编辑:德赢  点击数:[]

人工智能新目标――看懂视频

按照IBM的解释,人类能够观看一段简短的视频并轻松地描绘出视频内容,甚至能预测后续事件的发生,而这样的能力对机器来说依然是可望而不可及的。因此,IBM和MIT要做的就是,解决机器在认知和预测上的技术难题,在这一基础上开发出一套认知系统。

记者在岗亭玻璃上找到了一份简单的《告知》:“因广场重建,旋转木马需要暂时拆除,后续问题处理,现在无法一一通知到各位。请各位办卡会员加我微信,随时了解最新情况和处理办法。”

扫描二维码后,记者联系上了留下《告知书》的朱永涛,这名39岁的男子是周口西华人,他称自己从2012年底开始在这里经营游乐场。

“将心比心,我能一声不吭玩失踪吗?”他说,自己并不知道有网友称赞自己留下二维码处理问题的做法,不过确实有部分会员通过扫码找到了他,但是要求退款的人员并不多,不少会员在等待孩子重新在他的旋转木马上欢笑。(记者 汪永森 文/图)

但对AI来说,能理解猫为何会骑着Roomba扫地机器人在厨房与鸭子追逐嬉戏,才是彰显其能力之处。

去年9月,IBM与MIT宣布组建“IBM―MIT脑启发多媒体机器理解实验室”,双方将合作开发具有高级视听能力的AI。

嵩山路上一家大型商场关闭后,原本租用商场广场区域经营游乐设施的商户拆除了旋转木马,并在封闭施工的门口岗亭上留下了一纸通知和个人微信号,他的举动不但获得了客户的理解,还引来了不少人的称赞。

目前,科学家使用一些视频数据集来训练机器,以使其更好地理解真实世界中的行为,麻省理工学院(MIT)和IBM目前正携手进行相关研究。

解释视频的AI系统,包括自动驾驶汽车中的系统,常常依赖于识别静态框架中的对象,而非对行为进行解释。谷歌最近发布了一种能识别视频中对象的工具,并纳为云平台的一部分,该平台包含用于处理图像、音频和文本的AI工具。

11月27日,微博网友“郑州同城会”发文称,嵩山路的一个大型商场重新装修,原来在商场前租赁场地的经营者也搬走了。近一段,不断有办过卡的市民前来打听游乐设备经营者的去向,难道这老板“跑路”了?并没有,他在原先工作亭上留下了个人微信二维码,加微信好友协调处理有关情况。大家不但没有退款,商户还留住了客源。

“这次抽签将会给世人一个见识世界最强球队的机会,所有参赛队伍都会为了大力神杯而战,而这让人梦寐以求的奖杯只会被最富有韧性的球队所得。我衷心祝愿所有队伍一切顺利,也希望全世界的球迷们能够来到俄罗斯,让我们一同享受这道足球盛宴。”

因此,科学家面临的下一个挑战可能是教会机器不仅理解视频包含了什么内容,还要理解镜头中发生了什么。这可能带来一些实际的好处,比如带来强大的搜索、注释和挖掘视频片段的新方法,也可以让机器人或自动驾驶汽车更好地理解周围的世界如何运转。

目前,人工智能(AI)在图像和语音识别等领域表现出色,但科学家认为这还远远不够。据美国《麻省理工技术评论》杂志网站近日报道,对于AI的发展来说,理解视频中的动态行为是接下来的关键发展方向,这对于AI用其软件理解世界至关重要,也有助于AI在医疗、娱乐和教育等领域的广泛应用。

商场装修,商户留下微信二维码供客户联系

IBM的丹尼・古特弗罗因德说,有效识别行为要求机器学习某个行动,并将获得的知识应用于正在进行同样行动的情境中,这一领域的进步,即转移学习,对于AI的未来非常重要;而且,这项技术在实际中大有用途,“你可以用它来帮助改善对老年人和残疾人的护理,比如告诉护理人员是否有老人跌倒,或者他们是否已经吃过药等等。”

普林斯顿大学助理教授奥尔加・鲁萨克维斯基专门从事计算机视觉工作。他表示,此前科学家认为,很难开发出有用的视频数据集,因为它们需要比静止图像更多的存储和计算能力。他说:“我很高兴能使用这些新的数据集,3秒的时长很棒――它提供了时间上下文,同时对存储和计算的要求也比较低。”

他表示,目前自己仍在与接手商场业务的公司接触,希望明年可以重新将自己的旋转木马装回来。

前不久,MIT和IBM发布了一个庞大的视频剪辑数据集,这个名为“时间数据集时刻”的视频数据集囊括了从钓鱼到霹雳舞在内的许多动作的3秒钟片段。该项目负责人、MIT首席研究科学家奥德・奥利瓦说,世界上许多事情瞬息万变。如果你想明白为什么有些事情会发生,运动会给你提供很多信息。

“在这儿经营5年了,我和家长都成熟人了”

理解图像 还要理解动作行为

转移学习 人工智能的未来

“5年时间,我接触到很多家长和孩子。很多孩子在我这里从小玩到大,又有弟弟或者妹妹接着在这里玩。”朱永涛说,很多家长都对自己很好,也很信任他,部分家长办的第一种卡还没用完,又开始办理第二张卡,时间久了都成了熟人。

还有其他机构在研究更具创造性的方法。位于多伦多和柏林的创业公司“二十亿神经元(Twenty Billion Neurons)”创造了一个定制数据集。该公司联合创始人罗兰梅・尼塞维奇称,他们还使用了专门处理时间视觉信息的神经网络,“用其他数据集训练的AI可以告诉你,视频中显示的是足球比赛还是派对;用我们的定制数据集训练的神经网络可以告诉你,是否有人刚刚进入房间。”

昨日,郑报融媒记者找到了位于嵩山路与民安路交叉口西南区域的商场。这家大型商场正在重新装修,四周已被蓝色围挡围住。现场人员称,装修将持续至春节。

而因凡蒂诺也表达了他对所有人的欢迎和感谢,他说道:“首先我要感谢那些在过去七年当中日夜辛勤劳作的俄罗斯人民,是他们让世界杯能够如期进行,同时我也要感谢所有11座承办赛事的俄罗斯城市,他们正在进行着一项巨大而又艰难的工作。”

各出奇招 用视频训练计算机

MIT和IBM也表示,一旦机器能够看懂视频,具备视觉能力的高级计算机认知系统将能用于各种行业,不仅仅是医疗,还有教育、娱乐等领域,包括对复杂的机器进行保养和维修等。(科技日报北京12月11日电) 

“这个舞台属于所有足坛传奇,现在我们已经搭建好了这个舞台,所以也是时候让全世界的人们见识一下传奇球星们的能力了。就让我们好好享受这次抽签,同时也敬请期待明年夏天俄罗斯世界杯比赛的正式进行吧!”返回搜狐,查看更多

“在足球这项运动上,俄罗斯从不缺乏激情,当然俄罗斯也拥有着许多非常出色的球员,一代又一代皆是如此。”普京对记者说道。

之所以把视频长度定成3秒,是因为大部分时候,人类需要3秒时间,去观察并理解一个动作意图,比如,风吹树动,或者一个物体从桌上掉落下来等。

无独有偶,谷歌去年也发布了一套由800万个做了标记的YouTube视频组成的视频集YouTube-8M;脸谱正在开发名为“场景”“操作”和“对象”集的注释数据集。

KNOWLEDGE

行业知识

vwin德赢中国_www.vwinchina.com_德赢vwin中国官网
地址: 电话: 技术支持:vwin德赢中国_www.vwinchina.com_德赢vwin中国官网

本站关键词:成都景观设计|成都景观公司|四川园林景观设计|成都园林设计公司|成都园林景观设计|成都园林景观设计公司