Google Cloud 发布 COVID-19 数据集,可构建 AI 模型来对抗疫情
本文转自雷锋网,如需转载请至雷锋网官网申请授权。
3 月 31 日,Google 正式宣布启动一项名为新型冠状病毒公共数据集(COVID-19 Public Datasets)的项目,该项目将托管一个与疫情相关的公共数据资料库,并将它们开放,以便外界自由访问和分析。
Google 方面表示,这样做的目的是消除障碍,并为研究人员提供快速,便捷的关键信息访问途径,而无需搜索和携带大型数据文件。
雷锋网(公众号:雷锋网)了解到,在这个所谓的公共数据集项目中,其数据包括约翰·霍普金斯大学系统科学与工程中心(JHU CSSE)数据集、来自世界银行的全球健康数据和 OpenStreetMap 数据,所有这些都将免费存储在 Google Cloud 上——Google 也表示将与这些数据集背后的的组织提前接触。
按照 Google 的安排,这些数据集将带有 “ COVID-19” 标签,一个说明和几个示例查询,可以从 Google Cloud Console Market 和 BigQuery 用户界面中进行索索,其中在 BigQuery 中被标记为 “freebqcovid”。
值得一提的是,研究人员可以使用 Google 的 BigQuery ML 服务,该服务使用户可以使用 SQL 查询在 BigQuery(完全托管的数据仓库)中创建和执行机器学习模型,从而在 COVID-19 数据集上训练机器学习模型。
基于这个项目的公共属性,用户在查询时是完全免费的,并且查询免费政策一直持续到直到 9 月 15 日。但是 Google 指出,如果将任何数据集与非 COVID-19 数据集结合在一起,则处理的字节将计入 BigQuery Sandbox 中,每月有 10GB 的存储空间和 1TB 的查询限制——然后然后按量收费,以防止滥用。
Google BigQuery 产品经理兼GIS负责人Chad W. Jennings 和开发者倡导者 Shane Glass 在博客中表示:
这些数据集的内容仅严格出于教育和研究目的而向公众提供,Google Cloud 小组衷心希望COVID-19 公共数据集项目将能够更好、更快地赋能研究,以阻止疾病的蔓延。
雷锋网了解到,除了 COVID-19公共数据集计划,Google 也进行了许多其他对抗新型冠状病毒的努力。