7月4日消息,随着上海、北京等46个城市垃圾分类条例的出台。如何通过云计算、大数据、人工智能和物联网等先进计算技术将垃圾分类识别变得更加精准高效,成为科技公司的下一个攻破目标。
曙光公司大数据智能研究院院长宋怀明表示,现阶段,垃圾分类识别技术的计算产品、算法都较为成熟,难点在缺乏足够量的训练图片集。但是,对于成熟的垃圾分类识别技术的普及,宋怀明表示很乐观。他认为,复杂的多种垃圾定位分类应用,预计半年内也会成熟并普及使用。
据宋怀明介绍,在计算机大数据视觉分析领域,目前主要基于神经网络的算法进行图像分类,分类技术有很多种。具体到垃圾分类,有单一目标分类,即对整张图片进行分类,为图片给出唯一的分类标签,如单个瓶子的照片——可回收,果核照片——湿垃圾;有多目标检测分类,是对图片中的多种垃圾进行定位及单独分类,比如一堆垃圾中,瓶子是可回收,废纸则是干垃圾。前者,技术相对容易实现,市场上近期比较热门的几个手机垃圾分类的APP都是使用这种技术;后者则在生活中更为实用,应用场景更为广泛,但研发难度也更大。
现阶段,垃圾分类识别技术的计算产品、算法都较为成熟,难点在缺乏足够量的训练图片集。由于神经网络算法是一种数据驱动的方法,对训练样本数据量及质量要求较高,数据量越大,识别判断越精准。
宋怀明介绍,理想状态是每一类垃圾数据集为几万张图片,精准度可达到95%以上。如果图片集数量不足,精准度则会打折扣,这时候曙光的做法是用图像增强技术增加训练数据的量级,以提高识别精准度。
宋怀明认为,成熟的垃圾分类识别技术预计在半年内成熟并普及使用。毕竟46个城市,几亿人的刚需,市场空间和商业潜力巨大。(静静)