农业展望:从大数据里读懂“十年”
信息来源:中国科学报
种什么对?卖什么贵?对农业生产者来说,这或是决定一年收成的关键问题。相比于盲目跟风或罔顾需求,近几年,一份于每年春末出炉的报告或能给生产者的决策提供重要信息引导。
自2014年开始,中国农业展望大会每年召开并发布未来十年中国农业展望报告。4月20日至21日,2019中国农业展望大会如期在北京召开,会上发布了《中国农业展望报告(2019—2028)》。
展望报告中使用了宏观经济、资源环境、生产、库存、价格、消费、贸易等多方面数据;针对数据,分析人员进行了数据的集中程度、离散程度、分布状态以及主要变量关系的分析,用多种统计学方法对相关数据进行处理与校验。这样的一份报告,是集成、挖掘、分析、应用农业大数据的重要成果,也是农业信息分析学不断发展、农业监测预警理论体系不断完善的重要体现。
展望报告的技术支撑
对于粮、棉、油、肉、糖等18种重要农产品,展望未来10年的生产、消费、贸易、价格走势,《中国农业展望报告(2019—2028)》(以下简称展望报告)到底是怎样做到的?
农业农村部市场预警专家委员会秘书长、中国农科院农业信息研究所农业监测预警团队首席科学家许世卫介绍,要经过分析框架设定、基期数据确定、模型参数更新、模型运算分析、专家会商等多个环节,才能得出展望报告。
换言之,要形成一份展望报告,首先要数据,其次要模型工具,分析师和专家也必不可少。
“我们以大数据为支撑进行了基期状况分析,以模型为支撑进行了农产品供需预测分析,以系统为支撑进行了智能化分析。”许世卫接受《中国科学报》采访时表示。
据悉,展望报告中使用了宏观经济、资源环境、生产、库存、价格、消费、贸易等多方面数据;针对数据,分析人员进行了数据的集中程度、离散程度、分布状态以及主要变量关系的分析,用多种统计学方法对相关数据进行处理与校验。
为对未来中国农产品市场供需形势作出预测,分析人员基于许世卫团队研制的中国农产品监测预警系统(CAMES)构建了十几个模型,比如差异化消费预测模型方法、价格长短时记忆智能分析预测方法等。同时,以CAMES系统为支撑的智能化预测,也解决了多模型管理、模型多参数调用、平衡表编制等问题。
“农业监测预警技术支撑展望报告的发布,”许世卫说,“而农业展望是农业监测预警的重要出口之一,是组织强化农业信息监测预警体系、完善信息发布制度的重要工具。”
农业监测预警进入大数据时代
在许世卫看来,农业监测预警是基于信息流特征,对农业生产及其农产品市场全产业链过程中的环境因素、生物本体等进行信息特征提取、数据变化观测、信息流向追踪,并对未来进行态势分析、发布预告、采取应对措施、防范和化解农业风险的过程。
事实上,随着我国农业发展信息化水平的不断提升,农业监测预警的内涵也发生了显着变化。
据了解,几十年来,国内的农业监测预警主要经历了以传统计数与统计为基础的起步阶段、以计算机辅助为特征的成长阶段、以信息感知与智能分析为特征的成熟阶段等不同阶段。
新中国成立后至20世纪80年代后期,农业信息采集及分析、管理主要由人工完成, 依靠“一支笔、几张纸”,通过实地调查、访谈记录来收集信息。
20世纪80年代中后期到20世纪末,随着计算机及现代农业信息技术的应用,农业监测预警研究进入了信息化分析阶段,创建了一系列数据采集和处理的关键技术,逐渐建立预警与信息发布机制。
进入21世纪,互联网、物联网等信息技术为农业监测预警提供了更为有效的分析与管理工具,农业监测预警向系统化、集成化、智能化方向迈进。
“农业监测预警已经进入了大数据时代。”许世卫告诉《中国科学报》,现阶段数据获取实现了即时感知和广泛性采集,形成了动态和静态结合的大数据集合;数据分析实现了定性定量相结合;监测对象更加全面和细化;信息发布方式更为多元。
他表示,大数据应用将贯穿农业监测预警过程始终。随着数据来源更为广泛,类型更为丰富,结构更加复杂,“监测信息将从样本向总体延伸,分析对象和研究内容将变得更加细化,监测过程将从农业单一环节向全产业链、全过程、全生命周期扩展,预警周期也将由中长期向短期扩展,预警区域将从全国、省域向市域、县域、镇域,甚至是田块级别覆盖”。
农业大数据的“七十二变”
农业大数据具有体量大、复杂性高、潜在价值丰富的特征。据估算,一株苹果树能产生包含生物信息、株型信息、环境信息、管理信息、品质信息等在内至少1TB的数据量。
“农业数据量呈爆炸式增长,这些数据的集成、挖掘、使用,对于现代农业发展将会发挥极其重要的作用。”国家农业信息化工程技术研究中心主任、中国工程院院士赵春江告诉《中国科学报》。
监测预警只是农业大数据的典型应用之一,此外,农业大数据还可用于管理耕地数量质量、服务农业生产环节、促进农产品产销对接、掌握生产消费变化趋势等多领域。
不过,赵春江也指出,大数据系统需要解决三大问题:数据从哪里来,数据怎么用、数据给谁用。
他表示,农业大数据来源与获取相对复杂,农业生产、生产资料供给、农产品流通、市场需求以及与农业关联的气象、土壤、水文数据等搜集难、处理难、分析难、应用难,存在数据不共享、信息不连通的问题。
同时,在大数据识别和筛选过程中,缺乏基点调查、信息员队伍、数据分析师队伍等来保障大规模数据的采集、筛选和归纳分析,海量的数据也可能产生向异性信息,得到与事实完全相反的结论,数据挖掘和深度学习的难度较大。
“信息的采集、处理、分析及信息管理是农业监测预警的基本内涵,是在任何发展时期要解决的核心问题。”许世卫坦陈,迈入农业大数据时代,农业监测预警面对诸多新挑战。那么,应该如何充分利用大数据化繁为简、去伪存真?
他表示,急需建立以需求为导向的实时化信息采集技术,形成标准规范的农业基准数据库,构建多市场、多场景智能模型分析系统,形成可视化的预警服务表达和应用。
赵春江也建议,农业大数据获取成本较高,大数据的采集和建设要坚持应用需求导向,不要求大求全,农业大数据分析处理也要关注可适性问题。