机器学习模型,能分清川菜和湘菜吗?

  • 时间:
  • 浏览:3
  • 来源:大发5分6合APP下载_大发5分6合APP官网

一三个白多多地区的文化和当地的特色食物老会 分不开关系,里能说小到村庄,大到国家,每个地方都不 个人的“味道”。

日本比较有特色的清酒和酱油也都榜上有名。

可能性你在加利福尼亚州北部,如此 你将品尝到各种蔬菜,有暗蓝色的羽衣甘蓝,还有明亮的粉红色和黄色的甜菜。在韩国,诱人的红色泡菜可能性迎接你,而大海的气味会吸引你注意随近蠕动的鱿鱼。印度的市场你说什么是最丰厚多彩的,明亮的色调和几十种香料的香气:姜黄,八角茴香……



而在寒冷的俄罗斯,黄油则成为餐桌上必不可少的食材,成为战斗民族每天所需能量的重要来源。英国更无须多说,可能性你热爱黄油、奶油、土豆和牛奶,去英国本来我了!

得到的结果里能通过 matplotlib 进行可视化。通过数据分析,里能得出许多有意思的信息,比如,巴西菜用的最多的食材有洋葱、橄榄油、柠檬等。而在中国,柠檬显然都不 家常饭的常客。朋友用的最多的食材有酱、芝麻油、玉米淀粉等。小编猜测,老干妈一定对中国排名第一的食材有巨大贡献!

但是将 features 与 target 分别赋值到 train_ingredients 和 train_targets。通过统计分析等操作,里能计算出使用最频繁的前 10 种原料,并将原料名和冒出次数赋值到 sum_ingredients 字典中。通过样例数据,还能计算出意大利菜系中使用最频繁的前 10 种原料,并将原料名和冒出次数赋值到 italian_ingredients 字典中。

里能用机器学习的办法搭建、训练和测试模型,并通过评估矩阵来选则最优模型,实现原材料与菜系的映射。为了实现预期的功能,朋友不能 进行以下一三个白多多步骤。

作为一名合格的“吃货”,想看 “米、海苔、三文鱼”就想到日本寿司,想看 “鸡蛋、火腿、面包、沙拉酱”就想到三明治……通过食材预测菜系,用 python 就里能做到!

拿到数据后,首先对数据进行提取,其中配方节点如下。其中包含了食谱 id,菜肴类型和成分列表的训练集。

建立模型

建立模型的过程可能性稍微有点儿多样化,主要分以下四步进行:

原文发布时间为:2018-08-04

本文作者:Udacity

本文来自云栖社区合作协议伙伴“PaperWeekly”,了解相关信息里能关注“PaperWeekly”。

总的来说,要实现通过食材预测菜系的过程无须多样化,有但是怎样才能完善代码、优化模型,使分类体系和匹配程度更高,才是朋友要完成的关键目标。可能性如此 做到数据的有效清洗和分类,就会冒出本来我法国菜被误分为意大利菜从前的状态。

加载并分析数据

以意大利菜系为例,朋友准备好以下格式的样例数据。其中“id”代表不同的菜肴种类,“cuisine”则代表菜系名称。

调用 train_test_split 函数将训练集划分为新的训练集和验证集。

4、训练模型

在训练模型的过程中,不能 尝试不同的参数,选则出泛化力最好的模型。通过训练模型,里能计算得出验证集上的得分。得分越高,说明分类准确度(正确分类的菜肴百分比)越高。从前,一三个白多多优秀的模型就大功告成啦!

1、单词清洗

2、价值形式提取(使用TF_IDF)

3、数据分割与重排

模型预测

在测试文件 test.json 中,配方的格式与 train.json 相同,只删除了美食类型,可能性它是朋友要预测的目标变量。