乐趣区

关于cesium:下一代-3DTilesNext详解-6-瓦片属性数据组织扩展之-3DTILESmetadata

依赖于

3D Tiles 1.0

可选与必须

如果用到了属性元数据,那么这项扩大必须同时呈现在 extensionsUsedextensionsRequired 数组中,即“必须的”。

1. 概述

此扩大定义了一种在 3D Tiles 中存储结构化的元数据的机制,这些元数据个别又称作 属性数据 ,起源宽泛,可用于数据查看、剖析、款式化 3D Tiles 或者其余用处。

在本文中,我暂且称之为属性元数据。

这些属性数据要依据模板来记录,这种模板被称作“Schema(模式)”,使得属性数据有章可循。而且,不同层级的对象(最大的对象是 Tileset,顺次向下为 Tile 等)有不同的关联形式。

下列阐明不同层级的对象的元数据(属性)的细节:

  • 对于 Tileset 级别,属性元数据记录的是整个数据集级别的信息,比方数据公布年份等
  • 对于 Tile 级别,属性元数据能够记录更细粒度的信息,例如瓦片数据内容的最大高度等
  • 对于 Tile Content Groups 级别,能够将分组后的瓦片数据内容的属性元数据也分组来存储

对于瓦片数据内容外面的三维因素级别,也能够有属性元数据,参考 3.5 更深层次的因素级属性元数据

本扩大中的概念均为 三维元数据标准(3D Metadata Specification)的落实。

下图展现了 3D Tiles 中各个级别的对象(tileset、tiles、content、group)之间的关系及属性元数据的实例:

属性元数据有什么用

  • 间接查看:在界面上鼠标滑过或点击瓦片时,展现属性元数据
  • 分组:瓦片的数据内容能够分组,每个组能够有本人的属性元数据,这样就能够依据每个组本人的属性元数据来管制显示暗藏等组内瓦片全副统一的操作
  • 反对简单格局的数据:此扩大反对 Schema 嵌入在 JSON 内,也反对内部援用,这样各个领域的专家就能够把行业数据编入其中
  • 渲染优化:属性元数据可能会蕴含一些性能优化相干的参数,这样能够在遍历等有须要的时候优化相干算法

2. 属性元数据

2.1. 概述

Property 形容某个实体(实体指 Tileset、Tile 或者 TileGroup)的信息。

Schema 为 Class 定义数据类型等元数据信息。

每个实体,都是 Class 的具体实例,有着 Class 内记录的数据值。

此外,Statistics 可把特定 Class 内的统计值抽取进去独自存储;Semantic 则用于定义特定 Property 的用法和含意。

2.2. schema

一个 schema 个别由 classesenum 这两个形容数据存储格局的属性组成,其余描述性的属性有 idnamedescriptionversionextensionsextras

classes 由若干个 key-value 的 class 形成。

2.2.1. class

每个 class 形象了一类元数据,名称即 key。

有具体的 properties 形容由什么属性形成。

举例:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "building": {
            "properties": {"name": {},
              "id": {},
              "height": {}}
          }
        }
      }
    }
  }
}

"building" 即一个 class,它有 3 个 “property”:”name”、”id”、”height”,即上面一大节要介绍的 class property.

2.2.2. class property

每一个 class 都有 properties 属性对象,它的每一个 key-value 即一个 property

所有的 property 用来形容该 class 的数据形成。

用于形容一个 property 的属性,用 componentType、type、semantic 等字段来量度。

① property.componentType

属性的 componentType 即组分类型,有如下几种:

  • "BOOLEAN",布尔类型
  • "STRING",字符串类型
  • "ENUM",枚举类型,参考 2.2.3 大节
  • "INT8""INT16""INT32""INT64",有符号整型,从 8 ~ 64 位
  • "UINT8""UINT16""UINT32""UINT64",无符号整型,从 8 ~ 64 位
  • "FLOAT32""FLOAT64",浮点型,32 和 64 位两种

② property.type

有四类,均为字符串:

  • "SINGLE",默认的,单值类型
  • "ARRAY",数组类型
  • "VEC2""VEC3""VEC4",向量类型
  • "MAT2""MAT3""MAT4",矩(方)阵类型

其中,”SINGLE” 和 “ARRAY” 类型的 property,其元素能够是任何数据类型;”VECN” 和 “MATN” 类型的 property,其元素类型只能是数值。

③ property.semantic

能够为 property 打上非凡含意,即应用 property.semantic 属性,来标记前端所须要的额定的信息。它的值能够是任意的字符串,也能够是由标准内置的 semantic,见 三维元数据语义参考(3D Metadata Semantic Reference)

举例说明,以 “building” 这个 property 为例:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "building": {
            "properties": {"name": {"componentType": "STRING", "semantic": "NAME"},
              "id": {"componentType": "STRING", "semantic": "ID"},
              "height": {"componentType": "FLOAT32", "semantic": "_HEIGHT"}
            }
          }
        }
      }
    }
  }
}

可见它有 3 个 property:

“name”、”id” 和 “height”,

它们的 "semantic" 别离是:

“NAME”、”ID” 和 “_HEIGHT”。

其中,”NAME” 和 “ID” 是标准内置的,”_HEIGHT” 是自定义的。

2.2.3. enum

enum,即枚举,上一大节的 property.componentType 中容许有 "ENUM" 类型,即 class 的 property 的值,容许是枚举类型的。

举例:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "enums": {
          "qualityEnum": {
            "name": "Quality",
            "description": "An example enum defining expected quality of data within a tile.",
            "values": [{"name": "Unspecified", "value": 0},
              {"name": "Low", "value": 1},
              {"name": "Moderate", "value": 2},
              {"name": "High", "value": 3}
            ]
          }
        }
      }
    }
  }
}

enumsclasses 是同级别属性,此处定义了一个枚举类型 "qualityEnum",有个可用于显示的 "name" 属性 “Quality”,可见它的枚举值以数组模式给出:

[{"name": "Unspecified", "value": 0},
  {"name": "Low", "value": 1},
  {"name": "Moderate", "value": 2},
  {"name": "High", "value": 3}
]

其中,"name" 是枚举的值的名称,"value" 是枚举值的数值。

留神,此处 Unspecified 枚举值是非凡且是可选的,可用来辨认缺失的数据。

2.2.4. 内部 schema

"3DTILES_metadata" 不提供 "schema" 属性,则由内部 json 提供模式定义:

{
  "extensions": {
    "3DTILES_metadata": {"schemaUri": "https://example.com/metadata/buildings/1.0/schema.json"}
  }
}

2.3. statistics

统计信息用于记录各个 class 的统计学变量,例如数值的最大最小值、平均数,枚举的频次等。

代码中能够用这些统计信息来进行数据分析、显示等操作,例如应用 [申明式款式语言]()。

统计信息是按 class 提供的。基于整个 tileset 提供款式化或者无关上下文之后,程序代码只需治理好瓦片的下载和解决即可。

举例:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "building": {
            "properties": {"height": {"componentType": "FLOAT32"},
              "owners": {"type": "ARRAY", "componentType": "STRING"},
              "buildingType": {"componentType": "ENUM", "enumType": "buildingType"}
            }
          }
        },
        "enums": {
          "buildingType": {
            "valueType": "UINT16",
            "values": [{"name": "Residential", "value": 0},
              {"name": "Commercial", "value": 1},
              {"name": "Hospital", "value": 2},
              {"name": "Other", "value": 3}
            ]
          }
        }
      },
      "statistics": {
        "classes": {
          "building": {
            "count": 100000,
            "properties": {
              "height": {
                "minimum": 3.9,
                "maximum": 341.7,
                "_mode": 5.0
              },
              "buildingType": {
                "frequencies": {
                  "Residential": 50000,
                  "Commercial": 40950,
                  "Hospital": 50
                }
              }
            }
          }
        }
      }
    }
  }
}

这里只有一个 class,独自摘取其统计信息如下:

{
  "count": 100000,
  "properties": {
    "height": {
      "minimum": 3.9,
      "maximum": 341.7,
      "_mode": 5.0
    },
    "buildingType": {
      "frequencies": {
        "Residential": 50000,
        "Commercial": 40950,
        "Hospital": 50
      }
    }
  }
}

容易看出,数值属性 height 记录了最大最小值,别离是 341.7 和 3.9;枚举属性 buildingType 中三个枚举值的频率别离为 50000、40950、50.

2.3.1. 自定义统计值

标准容许增加自定义的统计信息,为了不与官网统计变量名称抵触,只需在自定义的统计变量名前加一个下划线,例如下面例子中 height 属性的自定义统计变量 _mode,其值是 5.0

2.3.2. 官网内置统计变量

名称 形容 实用类型
minimum 最小值 SINGLE、ARRAY、VECN、MATN
maximum 最大值 同上
mean 算术平均值 同上
median 中位数 同上
standardDeviation 标准差 同上
variance 方差 同上
sum 同上
frequencies 频次 ENUM

其中,frequencies 以对象模式呈现,其键是枚举的 name,值是频次;其余统计变量的值均为数值。见下面例子。

3. 元数据的调配

classes 只是定义了属性元数据的数据类型和含意,3D Tiles 中的理论元素并未真正具备理论的数据。

每个 3D Tiles 理论元素的属性元数据都会蕴含它属于哪个 class,用 class 的 name 来标识,而且属性元数据的具体属性字段都与 class 中规定的字段对应(名称统一,数据类型统一),如果某个属性字段在它的 class 中没有 required: true 的规定,那么它能够不呈现在 JSON 中。

大多数属性元数据间接写在 JSON 中,然而隐式瓦片宰割扩大的 tileset 中的隐式瓦片的属性元数据是例外,它用二进制的形式存储属性元数据。

分级:

  • Tileset 级别的属性元数据
  • Tile 级别的属性元数据(包含隐式瓦片的属性元数据)
  • ContentGroup 级别的属性元数据
  • ContentFeature 级别的属性元数据

接下来由粗到细地看属性元数据在各个层级的元素上的具体例子。

3.1. Tileset 层级的属性元数据

标准参考 tileset.schema.json 和 metadataEntity.schema.json

作用在整个 tileset 级别的属性元数据,常见的属性可能有:年份信息、数据生产者详细信息、tileset 的一般性上下文等。

例子:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "city": {
            "properties": {"name": {"componentType": "STRING", "semantic": "NAME", "required": true},
              "dateFounded": {"componentType": "STRING", "required": true},
              "population": {"componentType": "UINT32", "required": true},
              "country": {"componentType": "STRING"}
            }
          }
        }
      },
      "tileset": {
        "class": "city",
        "properties": {
          "name": "Philadelphia",
          "dateFounded": "October 27, 1682",
          "population": 1579000
        }
      }
    }
  }
}

这个例子中的 extensions 是整个 tileset.json 的顶级属性,tileset 属性和 schema 是同级别的,均为 extensions.3DTILES_metadata 的成分。

tileset 属性指定了这个 tileset 最顶级元素,即瓦片数据集自身的属性元数据。它的 class 是 "city",能够在 schema 中找到,例子中将 city 这个 class 的三条 required: true 属性调配到了,即 "name""Philadelphia""dateFounded""October 27, 1682""population"1579000

3.2. Tile 层级的属性元数据

标准参考 [tile.3DTILES_metadata.schema.json]() 和 [metadataEntity.schema.json]()

每个瓦片容许有本人的属性元数据,例如增加一些空间信息以不便空间索引算法的遍历。

上面的例子会应用内置的 semantic TILE_MAXIMUM_HEIGHT,具体参考 (3D Metadata Semantic Reference)[]

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "tile": {
            "properties": {
              "maximumHeight": {
                "semantic": "TILE_MAXIMUM_HEIGHT",
                "componentType": "FLOAT32"
              },
              "countries": {
                "description": "Countries a tile intersects.",
                "type": "ARRAY",
                "componentType": "STRING"
              }
            }
          }
        }
      }
    }
  },
  "root": {
    "extensions": {
      "3DTILES_metadata": {
        "class": "tile",
        "properties": {
          "maximumHeight": 4418,
          "countries": ["United States", "Canada", "Mexico"]
        }
      }
    },
    "content": {...},
    ...
  }
}

很容易看到这是一个传统的 tileset,没有应用隐式瓦片宰割扩大。

属性元数据作用在 root 瓦片的 extensions.3DTILES_metadata 属性上,指明了属性元数据遵循 tile 这个 class,它记录了 tile 这个 class 规定的两项属性字段,其中 maximumHeight 字段领有内置的语义(semantic)—— “TILE_MAXIMUM_HEIGHT”,其值指定为 4418countries 字段则是一个惯例的字符串数组,其值为 ["United States", "Canada", "Mexico"]

3.3. 隐式瓦片的属性元数据

标准参考 [subtree.3DTILES_metadata.schema.json]() 和 [metadataEntity.schema.json]()

此局部须要有 3DTILES_implicit_tiling 的先导根底。

若某个 tileset 启用了隐式瓦片宰割扩大,那么 tileset.json 中就没有每个 tile 的 JSON 定义了,此时每个 tile 的属性元数据就须要记录在别的中央,那就是 subtree 文件中的 JSON 和 binary 中,也就是说 3DTILES_implicit_tiling 扩大能够与 3DTILES_metadata 扩大兼容应用。

既然 subtree 文件是二进制文件,那罗唆就把属性元数据也编码进二进制中,JSON 局部只留读取二进制中属性元数据的字节存储形容信息。具体的编码标准,参考 三维元数据标准 – 存储格局 – Binary Table Format

二进制编码对大数据集是有益处的。

留神,瓦片的属性元数据仅对可见的瓦片无效,并且对于每个可见的隐式瓦片,就算没有某个属性字段,那这个属性的值也须要应用对应的 noData 符号占位。

实现留神:为了确定某个特定隐式瓦片的某个属性在属性数组中的索引值,须要依据该子树内所有隐式瓦片的可见性程序来计算这个隐式瓦片的前置可见瓦片数量。比方,如果在某个特定的隐式瓦片之前有 i 个可见瓦片,那么这个特定的隐式瓦片的某个属性值将存储在属性值数组的第 i 个。这些可见瓦片的简单的索引信息须要提前计算。

下列是一个 subtree 文件中 JSON 的局部(不蕴含正文):

{"tileAvailability": {"bufferView": 0},
  "contentAvailability": {"bufferView": 1},
  "childSubtreeAvailability": {"bufferView": 2},
  "extensions": {
    "3DTILES_metadata": {
      "class": "tile",
      "properties": {
        "horizonOcclusionPoint": {"bufferView": 3},
        "countries": {
          "bufferView": 4,
          "arrayOffsetBufferView": 5,
          "stringOffsetBufferView": 6
        }
      }
    }
  },
  "buffers": [{"byteLength": 99692}
  ],
  "bufferViews": [{"buffer": 0, "byteLength": 688, "byteOffset": 0},
    {"buffer": 0, "byteLength": 688, "byteOffset": 688},
    {"buffer": 0, "byteLength": 2048, "byteOffset": 1376},
    {"buffer": 0, "byteLength": 49152, "byteOffset": 3424},
    {"buffer": 0, "byteLength": 24576, "byteOffset": 50528},
    {"buffer": 0, "byteLength": 8196, "byteOffset": 75104},
    {"buffer": 0, "byteLength": 16388, "byteOffset": 83304}
  ]
}

瓦片可见性、瓦片内容可见性、孩子子树可见性数据被编码在 0、1、2 这三个 bufferView 所指向的二进制数据中,然而这个 subtree 的 buffer 却有 7 个 bufferView,其中 3、4、5、6 号 bufferView 正是给 3DTILES_metadata 用的。

3DTILES_implicit_tiling 规定了瓦片的宰割计划、子树的可见性内容编码,这样在 tileset.json 中就无需显示指定每一层每一个瓦片对象的信息了,所有都能够依据 level 和瓦片坐标计算而来。

与上一大节的 root 瓦片相似,在这一簇 子树中,每一个隐式瓦片的属性元数据都实现自 tile 这个 class,只不过具体的属性字段信息不再是 JSON,而是编码成了二进制,所以在 properties 中看到的数据指向是 bufferView 的编号。

例如,horizonOcclusionPoint 属性字段的数据存储在 bufferViews[3],countries 属性字段因为是不定长字符串数组类型,所以有三个数值须要存储,即数据自身 bufferView[4],存储 arrayOffset 的 bufferView[5],和存储 stringOffset 的 bufferView[6]。

具体二进制是如何存储这些类型各异的元数据的能够参考 三维元数据标准 – 存储格局 中 BinaryTableFormat 的局部,在 Array part 的第二个例子中有图示,简略的说就是数据自身是字符串的各个字符的字节信息,stringOffset 是每个字符串的起始长度,arrayOffset 则是每一个不定长字符串数组的起始 stringOffset 索引号。

3.4. Content Group 的属性元数据

标准参考 [group.schema.json]()、[tileset.3DTILES_metadata.schema.json]() 和 [metadataEntity.schema.json]()

一个 Tile 可能会蕴含超过一个数据内容(参考 3DTiles Next 扩大 3DTILES_multiple_contents),或者说多个瓦片数据内容是能够共享一个元数据的。本扩大能够与多重瓦片内容的瓦片一起搭配应用。

对属性元数据进行分组是有意义的,比方瓦片内只有一部分数据内容是有元数据的,这样只需记录有元数据的那局部瓦片内容的属性元数据;或者像“图层”一样应用多重瓦片内容的瓦片,能够应用属性元数据来管制瓦片的数据内容的可视化或者款式化。

瓦片数据内容是如何调配分组的属性元数据的呢?在 tile.content 的 JSON 中,记录其 extensions.3DTILES_metadata 属性,指派 group 属性即可。每个 tile.content 只能对应一个 group,然而一个 group 能够赋予给任意个 tile.content。

译者注

对于瓦片中的每个 group,其可能呈现一种状况:共用一个 class,然而每个 group 的具体属性元数据不同,须要别离给每个 group 记录属性元数据。

此时,在 schema 的同级别再定义一个 groups,每个 group 指定其 class 和 class 规定的 properties 值即可。而后每个 content 间接记录 group 的名称,即可实现多数据内容的 tile 共用一个 class,然而属性元数据又能够分组的情景。

官网将 group 具体的属性元数据抽离到 groups 中,而不是间接记录在 content 的 extensions 中,预计是为了不便解耦,让 content 专一于 content,然而 tile 的又是本人记录属性元数据,这让我有点蛊惑。

上面为官网例子:

{
  "extensions": {
    "3DTILES_metadata": {
      "schema": {
        "classes": {
          "layer": {
            "properties": {"name": {"componentType": "STRING", "semantic": "NAME", "required": true},
              "color": {"type": "VEC3", "componentType": "UINT8"},
              "priority": {"componentType": "UINT32"}
            }
          }
        }
      },
      "groups": {
        "buildings": {
          "class": "layer",
          "properties": {
            "name": "Buildings Layer",
            "color": [128, 128, 128],
            "priority": 0
          }
        },
        "trees": {
          "class": "layer",
          "properties": {
            "name": "Trees Layer",
            "color": [10, 240, 30],
            "priority": 1
          }
        }
      }
    }
  },
  "root": {
    "extensions": {
      "3DTILES_multiple_contents": {
        "content": [
          {
            "uri": "buildings.glb",
            "extensions": {"3DTILES_metadata": {"group": "buildings"}}
          },
          {
            "uri": "trees.glb",
            "extensions": {"3DTILES_metadata": {"group": "trees"}}
          }
        ]
      }
    },
    ...
  }
}

这个例子有一个 layer class,与 schema 同级别的有一个 groups 属性,意味着属性有两个分组,一个是 buildings 属性,一个是 trees 属性,这两个的属性均为 layer 这个 class 的具象化,而落实到具体的瓦片数据内容上,就是 root 瓦片的两个复合数据内容所指派的信息了,譬如 content[0],它的 uri 是 "buildings.glb",它的属性元数据指派为 buildings 这个 group。

3.5. 更深层次的因素级属性元数据

3D Tiles 只记录瓦片的构造拓扑,然而每个瓦片的数据内容依然能够细分为不同的层级。

这部分不属于 3D Tiles 中“tile”的定义了,须要到 glTF 的扩大中补充扩大定义,即 EXT_mesh_features 扩大,这与 3DTILES_metadata 并不抵触,都是 [三维元数据标准(3D Metadata Specification)]() 的内容,只不过上述四类属于瓦片层级,再往下探则能细化元数据到 glTF 的 primitive、mesh、node 等元素里了。

4. JSON 模式定义

  • tileset.3DTILES_metadata.schema.json
  • tile.3DTILES_metadata.schema.json
  • content.3DTILES_metadata.schema.json

译者注

属性元数据扩大,即 3DTILES_metadata,首先在 3D Tiles 标准的次要空间实体对象上定义了“属性数据”,因为这些空间实体对象自身就是“三维数据”,所以这些属性数据其实就是“数据的数据”,即元数据。

为了更好地存储来自各个领域的属性数据,此扩大设计了 Schema {Class { Properties} } 这种模板,而后在对应的空间实体对象上记录具体的数据项。Schema 中还容许规定 Enum,是除了根本数据类型、数组、向量、矩阵之外的一个特色数据类型。

与 Schema 同级别的定义还有 Tileset、Group、Statistics 三个数据项,关照到了数据集级别、瓦片分组数据内容级别的元数据,以及存储了所有元数据中 Class 的统计数据。

上述 Schema、Class、Properties、Tileset、Group、Statistics、Enum 均大写结尾,并不是指 JSON 中的字段名,这里只是为了行文上难看,对立写法。

为了配合隐式瓦片扩大,属性元数据在 subtree 文件中还有非凡的编码格局(二进制),尤其是字符串,细节比拟多。

除了在 3D Tiles 标准的次要空间实体对象上做出这些属性元数据的扩大外,在瓦片数据内容中的“三维因素”上,也能够定义属性元数据,然而瓦片数据内容曾经不是 3D Tiles 的内容了,而是 glTF、瓦片格局的内容。针对 glTF 格局,须要查阅衍生扩大标准:

  • EXT_mesh_features
  • [EXT_gpu_mesh_instancing]()

而包含本扩大、glTF 上述两个扩大在内,独特形成了下一代 3D Tiles 属性元数据的任意层级标准,它们的制订还波及两个材料:

  • 三维元数据标准(3D Metadata Specification)
  • 三维元数据语义参考(3D Metadata Semantic Reference)
退出移动版