Google Cloud发新冠病毒数据集 可构建AI模型来对抗疫情
日前,Google正式宣布启动一项名为新型冠状病毒公共数据集(COVID-19 Public Datasets)的项目,该项目将托管一个与疫情相关的公共数据资料库,并将它们开放,以便外界自由访问和分析。
Google方面表示,这样做的目的是消除障碍,并为研究人员提供快速,便捷的关键信息访问途径,而无需搜索和携带大型数据文件。
在这个所谓的公共数据集项目中,其数据包括约翰·霍普金斯大学系统科学与工程中心(JHU CSSE)数据集、来自世界银行的全球健康数据和 OpenStreetMap 数据,所有这些都将免费存储在 Google Cloud 上——Google也表示将与这些数据集背后的的组织提前接触。
按照Google的安排,这些数据集将带有 “ COVID-19” 标签,一个说明和几个示例查询,可以从 Google Cloud Console Market 和 BigQuery 用户界面中进行索索,其中在 BigQuery 中被标记为 “freebqcovid”。
值得一提的是,研究人员可以使用 Google 的 BigQuery ML 服务,该服务使用户可以使用 SQL 查询在 BigQuery(完全托管的数据仓库)中创建和执行机器学习模型,从而在 COVID-19 数据集上训练机器学习模型。
基于这个项目的公共属性,用户在查询时是完全免费的,并且查询免费政策一直持续到直到 9 月 15 日。但是 Google 指出,如果将任何数据集与非 COVID-19 数据集结合在一起,则处理的字节将计入 BigQuery Sandbox 中,每月有 10GB 的存储空间和 1TB 的查询限制——然后然后按量收费,以防止滥用。
Google BigQuery产品经理兼GIS负责人Chad W. Jennings 和开发者倡导者 Shane Glass 在博客中表示:
这些数据集的内容仅严格出于教育和研究目的而向公众提供,Google Cloud 小组衷心希望COVID-19 公共数据集项目将能够更好、更快地赋能研究,以阻止疾病的蔓延。
除了 COVID-19公共数据集计划,Google 也进行了许多其他对抗新型冠状病毒的努力。
比如说,Google 向与该病毒作斗争的组织捐赠了8亿美元的广告和贷款,添加了新型冠状病毒提示 Google Assistant 快捷方式,并与 Microsoft 和 Palantir 合作,为英国国家卫生局(National Health Service)建立了信息发布台。
另外,Google还推出了专门的页面和搜索门户来整理有关 COVID-19 的资源,这家科技巨头的母公司 Alphabet 也加大了湾区疾病筛查计划的力度。