Formatos de ficheiros suportados
Esta página documenta os formatos de ficheiros presentes no arquivo de dados marinhos e o seu estado de suporte no pipeline de extração do SeisLabData.
Formatos raster GDAL
Estes formatos são lidos através de drivers raster GDAL. O extrator consegue obter: caixa delimitadora (bounding box), código CRS/EPSG, número de bandas, resolução de píxel e valor nodata.
GeoTIFF
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .tif, .tiff |
| Tipo de média | image/tiff |
| Driver GDAL | GTiff |
| Categorias | Batimetria, Backscatter |
| Fases | Controlo de qualidade, Dados processados, Dados interpretados |
Formato raster georreferenciado com CRS e metadados incorporados. Amplamente suportado em ferramentas SIG. Utilizado como ficheiro principal para grelhas de batimetria/backscatter processadas e produtos interpretados.
Grelha XYZ
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .xyz |
| Tipo de média | text/plain |
| Driver GDAL | XYZ |
| Categorias | Batimetria, Backscatter |
| Fases | Dados em bruto, Controlo de qualidade, Dados interpretados |
Formato de nuvem de pontos em texto simples com colunas X, Y, Z. Utilizado como ficheiro principal para dados de batimetria em bruto/controlo de qualidade e como ficheiro secundário nalgumas fases. O GDAL lê-o como um conjunto de dados raster em grelha.
ASCII Grid
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .asc |
| Tipo de média | text/plain |
| Driver GDAL | AAIGrid |
| Categorias | Batimetria, Backscatter |
| Fases | Dados interpretados |
Formato raster ASCII da ESRI. O cabeçalho define as dimensões da grelha, tamanho da célula, origem e valor nodata, seguido de valores de célula separados por espaços. Utilizado como ficheiro principal para produtos interpretados.
Float Grid
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .flt + .hdr |
| Tipo de média | application/octet-stream |
| Driver GDAL | EHdr |
| Categorias | Batimetria, Backscatter |
| Fases | Dados processados, Dados interpretados |
Formato raster binário que armazena valores de vírgula flutuante IEEE de 32 bits em ordem
row-major. Requer um ficheiro de cabeçalho .hdr complementar contendo metadados da grelha
(ncols, nrows, cellsize, nodata_value, byteorder). Utilizado como ficheiro secundário para
dados processados e como principal/secundário para produtos interpretados.
NetCDF
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .nc, .nc4 |
| Tipo de média | application/x-netcdf |
| Driver GDAL | netCDF |
| Categorias | Batimetria, Backscatter |
| Fases | Dados processados, Dados interpretados |
Network Common Data Form, formato binário auto-descritivo amplamente utilizado em dados oceanográficos, atmosféricos e climáticos. O GDAL consegue ler ficheiros NetCDF como conjuntos de dados raster, mas apenas quando seguem as convenções CF (Climate and Forecast) com variáveis de coordenadas, dimensões e atributos de mapeamento de grelha devidamente definidos. Ficheiros NetCDF não estruturados ou que não sigam a estrutura padrão CF não podem ser lidos pelo GDAL.
CSV
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .csv |
| Tipo de média | text/csv |
| Driver GDAL | CSV |
| Categorias | Batimetria, Backscatter |
| Fases | Dados em bruto, Controlo de qualidade, Dados interpretados |
Ficheiro de texto com valores separados por vírgulas ou delimitadores, contendo dados de pontos (X, Y, Z ou lon, lat, valor). Semelhante ao XYZ mas com linha de cabeçalho e nomeação flexível de colunas. O OGR lê-o como um conjunto de dados vetorial de pontos; pode também ser tratado como raster via VRT.
Formatos vetoriais OGR
Estes formatos são lidos através de drivers vetoriais OGR. O extrator consegue obter: caixa delimitadora (bounding box), código CRS/EPSG, contagem de elementos e tipo de geometria.
Shapefile
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .shp + .shx + .dbf |
| Tipo de média | application/x-shapefile |
| Driver OGR | ESRI Shapefile |
| Categorias | Batimetria |
| Fases | Dados em bruto, Controlo de qualidade, Dados processados, Dados interpretados |
Formato vetorial ESRI que armazena geometrias de pontos, linhas ou polígonos com dados de
atributos. Os ficheiros complementares .shx (índice) e .dbf (atributos) são obrigatórios.
Utilizado como ficheiro secundário em todas as fases do fluxo de trabalho.
CSV
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .csv |
| Tipo de média | text/csv |
| Driver OGR | CSV |
| Categorias | Batimetria, Backscatter |
| Fases | Dados em bruto, Controlo de qualidade, Dados interpretados |
Ficheiro de texto com valores separados por vírgulas ou delimitadores, contendo dados de pontos com colunas de coordenadas (X/Y, lon/lat). O OGR lê-o como um conjunto de dados vetorial de pontos quando as colunas com coordenadas são identificadas. Também listado nos formatos raster GDAL, pois pode ser tratado como raster em grelha via VRT.
File Geodatabase
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .gdb (diretório) |
| Tipo de média | application/x-filegdb |
| Driver OGR | OpenFileGDB |
| Categorias | Batimetria, Backscatter |
| Fases | Dados em bruto, Controlo de qualidade, Dados processados, Dados interpretados |
ESRI File Geodatabase, um diretório contendo múltiplos ficheiros de base de dados que armazenam conjuntos de dados vetoriais e raster. Utilizado como ficheiro secundário para dados em bruto/controlo de qualidade/processados e como principal/secundário para produtos interpretados. Acesso apenas de leitura através do driver OpenFileGDB (sem necessidade de licença ESRI).
GeoJSON
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .geojson, .json |
| Tipo de média | application/geo+json |
| Driver OGR | GeoJSON |
| Categorias | Batimetria, Backscatter |
| Fases | Dados processados, Dados interpretados |
Formato aberto para codificação de estruturas de dados geográficos em JSON. Suporta geometrias de pontos, linhas, polígonos e multi-geometrias com propriedades associadas. Utiliza sempre WGS 84 (EPSG:4326) como sistema de referência de coordenadas.
GeoPackage
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .gpkg |
| Tipo de média | application/geopackage+sqlite3 |
| Driver OGR | GPKG |
| Categorias | Batimetria, Backscatter |
| Fases | Dados processados, Dados interpretados |
Norma aberta OGC baseada em SQLite. Permite armazenar dados vetoriais e raster num único ficheiro. Suporta múltiplas camadas, índices espaciais e CRS arbitrário. Alternativa moderna ao Shapefile e ao File Geodatabase.
KML/KMZ
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .kml, .kmz |
| Tipo de média | application/vnd.google-earth.kml+xml |
| Driver OGR | KML / LIBKML |
| Categorias | Batimetria, Backscatter |
| Fases | Dados interpretados |
Formato de marcação do Google Earth para visualização geográfica. O KML é baseado em XML; o KMZ é um arquivo comprimido (ZIP) contendo um ficheiro KML e recursos opcionais. Suporta geometrias de pontos, linhas e polígonos. Utiliza sempre WGS 84 (EPSG:4326). O OGR consegue ler tanto KML como KMZ através dos drivers KML ou LIBKML.
Formatos especializados (futuro)
Estes formatos requerem extratores dedicados que ainda não estão implementados. Serão adicionados em iterações futuras.
CSAR
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .csar |
| Tipo de média | application/octet-stream |
| Categorias | Batimetria, Backscatter |
| Fases | Dados processados |
Ficheiro CARIS Spatial Archive. Formato raster proprietário para dados de batimetria e elevação em grelha. Utilizado como ficheiro principal para dados processados. Requer software/licença CARIS para acesso completo.
KMALL
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .kmall |
| Categorias | Batimetria, Backscatter |
| Fases | Dados em bruto |
Formato binário baseado em datagramas dos sistemas de ecossonda multifeixe Kongsberg. Contém
dados de posição (latitude, longitude, marca temporal), medições de profundidade e indicadores
de qualidade. O datagrama #SPO fornece dados de posição; o #MRZ fornece
profundidade/refletividade.
Um módulo Python para leitura de datagramas está disponível no GitHub.
SEG-Y
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .segy, .sgy |
| Categorias | Sísmica |
| Fases | Dados em bruto |
Formato padrão de troca de dados sísmicos (SEG-Y Revisão 2.0). Estrutura:
- Cabeçalho de texto (3200 bytes)
- Cabeçalho binário (400 bytes)
- Cabeçalho de texto estendido (opcional)
- Traços (traços sísmicos individuais com cabeçalhos de 240 bytes)
Bibliotecas Python: segyio (mantida ativamente, pela Equinor) e segpy.
JSF
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .jsf |
| Categorias | Sísmica |
| Fases | Dados em bruto |
Formato de dados de sonar EdgeTech. Formato binário com estrutura de cabeçalho definida (JSFDefs.h). Utilizado para dados em bruto de perfilador de sub-fundo (SBP).
P1/11
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .p111 |
| Categorias | Dados de posição geofísica |
| Fases | Dados em bruto |
Formato de troca de dados de posição geofísica. Pode ser importado utilizando o plugin SeisPos_Import do QGIS.
Outros formatos
Projeto HIPS
| Propriedade | Valor |
|---|---|
| Extensão(ões) | Diretório (estrutura proprietária) |
| Categorias | Batimetria |
| Fases | Dados processados |
Diretório de projeto CARIS HIPS e SIPS. Formato proprietário contendo dados multifeixe processados. Não está prevista extração automatizada, tratado como um diretório opaco.
XLS
| Propriedade | Valor |
|---|---|
| Extensão(ões) | .xls, .xlsx |
| Tipo de média | application/vnd.ms-excel |
| Categorias | Batimetria |
| Fases | Dados em bruto, Controlo de qualidade, Dados processados |
Dados tabulares em folha de cálculo. Utilizado como ficheiro secundário para metadados ou informação auxiliar. Sem suporte GDAL/OGR — necessitaria de um leitor dedicado caso a extração seja necessária.