地理空间数据是描述地球表面之上或接近地球表面的物体、事件或其他特征的信息。 地理空间数据一般将位置信息(通常是地球上的坐标)和属性信息(相关对象、事件或现象的特征)与时间信息(位置和属性存在的时间或寿命)结合起来。 所提供的位置短期内可能为静态(例如一件设备、地震事件、贫困儿童的位置),也可能为动态(例如移动的车辆或行人、传染病的传播)。
地理空间数据通常包括以不同的格式从不同的来源收集的大量空间数据集,其中有人口普查数据、卫星图像、天气数据、手机数据、所绘制图像和社交媒体数据等信息。 当地理空间数据可以发现、共享、分析并与传统的业务数据结合使用时,它发挥的作用最大。
地理空间分析用于向传统类型的数据添加时间和位置,构建数据可视化。 这些可视化可以包含地图、图表、统计数据和统计图,显示历史变化和当前变化。 所附加的上下文支持对事件进行更完整的描述。 大量电子表格中可能被忽视的洞察在易于识别的视觉模式和图像中得到了揭示。 这样可以更快速、更方便、更准确地做出预测。
地理空间信息系统 (GIS)特别与可视化表现中数据的物理映射息息相关。 例如,当飓风地图(显示位置和时间)与另一层显示潜在雷击区域的图层相叠加时,您就会看到 GIS 所发挥的作用。
地理空间数据类型
地理空间数据是与某种类型的地理指标一起记录的信息。 地理空间数据有两种主要形式:矢量数据和栅格数据。
矢量数据是点、线和多边形表示房产、城市、道路、山脉和水体等特征的数据。 例如,使用矢量数据的视觉表示可能包含由点表示的房屋、由线表示的道路和由多边形表示的整个城镇。
栅格数据是根据行和栏进行标识的像素化或网格化的单元格。 栅格数据产生的图像,例如照片和卫星图像,实质上要更加复杂。
地理空间数据示例
地理空间数据示例包括:
地理空间技术
地理空间技术是指收集、存储和组织地理信息的全部技术。 其中包括卫星技术,可以进行地理测绘和地球分析。 地理空间技术在若干相关技术中都有所应用,如地理信息系统 (GIS),全球定位系统 (GPS),地理围栏和遥感。
地理空间技术和 Python
广受欢迎的编程语言 Python 非常适合处理地理空间数据,能够容纳矢量数据和栅格数据,这两种是地理空间数据的典型表示方式。 可以使用 Fiona 和 GeoPandas 等程序处理矢量数据。 可以使用诸如 xarray 等程序处理栅格数据。
处理大量地理空间数据集面临着许多挑战。 出于这个原因,许多企业都在努力充分利用地理空间数据的优势。
首先,有大量的地理空间数据。 例如,据估计,每天会生成 100 TB 的天气相关数据。 仅这一点就给大多数企业带来了巨大的储存和访问问题。 地理空间数据还存储在许多不同的文件中,给找到解决特定问题所需数据的文件带来困难。
此外,地理空间数据以许多不同的格式储存,并根据不同的标准进行校准。 任何比较、合并或映射数据的工作都首先需要对大量的数据进行清除和重新格式化。
最后,处理原始地理空间数据需要专业知识和应用高等数学来完成必要任务,例如数据层的地理空间对齐。 除非分析人员十分精通,并经验丰富,否则他们将无法从数据获取价值,也难以朝着企业的业务目标迈进。
地理空间数据收集
因为企业通常需要的地理空间数据量非常巨大,所以他们希望使用服务来获取经过精心策划的地理空间数据。
无论您从何处获取地理空间数据,数据质量必须始终保证。 数据匮乏会导致模型使用极少或受限。 (警示名言“数据不良,洞察不良”经证明千真万确。) 这似乎不言而喻,企业可以从适当使用管理和策划数据的解决方案中受益,这样任何“垃圾”数据都会得到恰当处理。
地理空间数据管理
现在的数据如此丰富,管理数据就变得相当重要。 许多企业发现自身被数据淹没,于是他们求助内部的数据科学家帮助管理数据。 据估计,多达 90% 的数据科学家的时间都花在了数据策划活动上,包括组织、“清理”和重新格式化数据。 这样一来,这些数据科学家每一工作日中只有 10% 的时间用于分析数据趋势,并利用这些洞察帮助制定业务策略。
公司采用IBM Environmental Intelligence Suite等解决方案进行数据收集和数据管理时,就可以更高效地执行这两项活动。 该解决方案可以扩展,而且基于云,能够适应不同的文件格式。 通过使用精心策划的优化信息数据库,数据科学家可以有更多时间专注于如何使用分析洞察,将其转化为企业进展和业务影响。
虽然地理空间分析由 GIS 赋权,最初用于地质学、生态学和流行病学等生命科学方面,但在此之后,地理空间分析在大多数行业的使用都愈发显现。 现在它的应用触及国防和社会科学等多个行业。 地理空间分析产生的洞察影响着和自然资源管理和国家情报同等重要的问题。
地理空间分析有助于同时研究多种事情,监视数百甚至数千个事件,并从中收集相关数据。 这为各种规模的企业提供了利用数据做出更明智业务决策的机会:
近年来,由于物联网 (IoT) 内部的相对爆炸式发展,分析大量数据的工作更具挑战性。 各种类型和用途的物体和设备现在都设计为能够传输与该设备的性能或协议相关的数据。 这对地理空间分析是个好消息,因为地理空间分析需要大量的数据来收集有价值的洞察。
地理空间分析
通过地理空间分析收集的数据,与根据时间和空间组织数据,最大限度地提高数据影响的增强视觉方法相结合,就是地理空间分析。
当数据以这种方式可视化时,研究数据的人更容易发现可能在起作用的趋势的迹象。 地理空间分析能够有效地传达变化情况的形状和能量。 随着这种情况的相关数据收集越来越多,就越容易发现这种情况中的细微差别。
地理空间分析市场目前增长可观且稳定,事实上在审查中,到 2025 年,该市场的价值预计将增长到 963 亿美元,在 5 年期间实现 12.9 %的年销售额增长。¹
地理空间行业应用
以下是不同行业使用地理空间分析的方式:
根据人口数据、直播视频、地图和天气,使用地理空间分析模型绘制 COVID-19 地图。
通过用户定义的功能 (UDF),地理空间分析支持参与植被管理的人员评估水和湿度水平。
用户定义的功能还可以帮助气象学家处理传入的数据,绘制龙卷风可能在该地区通过的路径。
在一个平台上拥有如卫星图像、人口普查数据和风势预测等相关数据,可以让事故指挥官绘制野火增长和移动的图表。
大多数专家预计,地理空间技术将变得越来越复杂,尤其是在该技术与机器学习和 AI 密切相关的情况下。
事实上,预计地理空间 AI 即将盛行,为机器学习带来地理元素。 专家们还预测,制图将成为一种服务,根据消费者或行业需求,用户可以租用极高分辨率的定制地图。
此外,还在开发专门依赖地理空间技术的新型交通工具。 它们将使用的更为频繁——无论是携带包裹穿越天空(无人机),还是自动驾驶在路上(自动驾驶汽车)。 这些技术还将应用于新的应用程序,例如使用无人机进行航空测绘。
¹ 地理空间分析市场 (链接位于 ibm.com 外部),市场与市场,2020 年 8 月。