脸书研发超强「逆烹饪」技术:只要丢一张食物照片,AI 就可以

  • 260views

脸书研发超强「逆烹饪」技术:只要丢一张食物照片,AI 就可以

透过一张简单的食物照片你能看到什幺?当时和你一起吃饭的人?用餐的那个餐馆播放的爵士乐?或者是怀念那一口美味的,自己却做不出吃不到的家乡菜?

Facebook 最新研究,使用 AI 技术,只需要一张食物的图片就可以洞悉它的烹饪方法。

该系统透过新颖的架构预测成分作为集合,在不强加任何顺序的情况下对其依赖性进行建模,然后透过同时处理图像及其推断成分来生成烹饪指令。

AI 变身大厨:看一眼就知道这道菜怎幺做的

一份优良的食谱不仅能够写清楚配料,还要有清晰的烹饪步骤,例如大火爆炒几分钟,小火慢炖几分钟,是切丝还是切块等等。

之前,传统的做法是将图片转图谱问题看做一种「检索任务」,即根据图片的相似度从食谱数据集中配对烹饪方案。

这类系统的性能在很大程度上取决于数据集的大小和多样性,以及图片的品质。如果数据集中根本没有图片对应食谱,这个系统就非常失败。

将图片到食谱看成条件生成问题可以很好的解决传统系统的难题。换句话说,与直接的图片配对不同,后者更多的是预测配料的成分,然后根据配料和其对应的美食图片生成烹饪步骤。

脸书研发超强「逆烹饪」技术:只要丢一张食物照片,AI 就可以除了食谱,之后可能还能识别卡路里

从食品图片到菜谱,需要获得超越仅仅是可见的图片之外的讯息,这对于当前的电脑视觉系统无疑是一个巨大挑战。

与单纯理解自然图像相比,视觉成分预测需要的还有高级推理和先验知识,例如,羊角麵包中含有黄油。 因为食品具有比较高的类别内可变性 intra-class variability,食物的形态在烹饪过程中发生改变,一道煮熟的菜餚和生的原料的样子可能天差地别。

逆烹饪的实现是迈向更广泛的食品理解系统的第一步,接下来也许就可以透过照片实现系统对于食物的卡路里估算和自动创建食谱。

成分预测也可以用于解决更广泛的问题,例如实现图象到集合的预测。

更多厉害的人工智慧

我的工作会被人工智慧取代?你更应该问:如何让 AI 为我工作
一个「值得信赖 AI」长什幺样子?欧盟发布 7 条人工智慧的道德準则
Open AI 把人工智慧丢进荒地,看见了人类历史演进的脉络