近日,美国国家海洋和大气管理局(NOAA)、美国国家航空航天局(NASA)联合科技公司Brightband,推出首个人工智能(AI)模型训练专用观测数据集——NNJA-AIv01。该数据集基于NOAA-NASA,联合数据集(NNJA)构建,涵盖1979年至今的大气、海洋、冰雪和陆地观测资料,并向公众免费开放。
NNJA项目源于NOAA与NASA为期三年的深度合作,旨在整合双方的历史观测数据及欧洲合作伙伴的再分析观测资料,形成连续的“再分析”产品。该项目核心突破在于解决长期存在的数据格式不统一、质量控制标准差异等问题,并通过严格筛选保留具有科学意义的不同版本数据。
研发团队将NNJA数据重新格式化为便于读取和处理的格式,形成首版数据集。在NNJA-AIv01中,团队对大量卫星数据(包括微波探测仪、红外探测仪和地球静止轨道图像数据)和常规数据(地面气象站、探空以及飞机观测数据)进行重新处理。目前NNJA-AIv01已在谷歌云平台上线,并计划在亚马逊云服务平台发布。
(来源:NOAA地球预测创新中心官网 编译:何静怡 张丽亚 责任编辑:曹锐怡)