Springe zum Hauptinhalt
Professur Digital- und Schaltungstechnik
THEOStereo
Professur Digital- und Schaltungstechnik 

THEOStereo

THEOStereo ist ein Datensatz bestehend aus synthetischen Stereo-Bildpaaren sowie den dazugehörigen Szenentiefen und wird zusammen mit [1] veröffentlicht. Alle Bilder unterliegen dem omnidirektionalen Kameramodell. Insgesammt besteht der Datensatz aus 31.250 omnidirektionalem Bildpaaren. Die Trainingsuntermenge umfasst 25.000 Bildpaare. Test- und Validierungsuntermenge bestehen aus jeweils 3.125 Bildpaaren. Zu jedem Bildpaar existiert eine Ground-Truth-Tiefenkarte, welche pixelweise den Abstand zum Objekt entlang der Z-Achse der linken Kamera beschreibt. Die virtuellen omnidirektionalen Kameras weisen ein Sichtfeld von 180 Grad auf und können mit Hilfe von Kannalas Kameramodell [2] beschrieben werden. Die Verzerrungsparameter sind k1 = 1 und k2 = k3 = k4 = k5 = 0. Die Baseline der Stereokamera beträgt 0,3 m 0,3 AU (ca. 15 cm).

Abb 1: Bild der linken Kamera
Abb 2: Bild der rechten Kamera
Abb 3: Szenentiefe (Ground Truth)

Aufbau des Datensatzes

.
├── README.md
├── test
│   ├── depth_exr_abs
│   ├── img_stereo_webp
│   └── img_webp
├── train
│   ├── depth_exr_abs
│   ├── img_stereo_webp
│   └── img_webp
└── valid
    ├── depth_exr_abs
    ├── img_stereo_webp
    └── img_webp

The Ordner depth_exr_abs beinhaltet die Tiefenkarten in Metern, wobei sich die Tiefe auf die linke Kamera bezieht. Alle Bilder der linken Kamera sind in img_webp gespeichert. Die Bilder der rechten Kamera finden Sie unter img_stereo_webp.

Lizenz

Creative Commons Lizenzvertrag Der Datensatz ist lizenziert unter einer Creative Commons Namensnennung 4.0 International Lizenz.

Download

Linux-Benutzern empfehlen wir den Download über download.sh.
Wer den Datensatz manuell herunterladen und entpacken möchte, findet den Datensatz hier.
Der Konferenzartikel kann hier heruntergeladen werden.

BibTeX

Wenn Sie den Datensatz in Ihrer Arbeit verwenden, bitte folgende Referenz nicht vergessen:

@inproceedings{seuffert_study_2021,
  address = {Online Conference},
  title = {A {Study} on the {Influence} of {Omnidirectional} {Distortion} on {CNN}-based {Stereo} {Vision}},
  isbn = {978-989-758-488-6},
  doi = {10.5220/0010324808090816},
  booktitle = {Proceedings of the 16th {International} {Joint} {Conference} on {Computer} {Vision}, {Imaging} and {Computer} {Graphics} {Theory} and {Applications}, {VISIGRAPP} 2021, {Volume} 5: {VISAPP}},
  publisher = {SciTePress},
  author = {Julian Bruno Seuffert and Ana Cecilia Perez Grassi and Tobias Scheck and Gangolf Hirtz},
  year = {2021},
  month = {2},
  pages = {809--816}
}

Referenzen

[1] J. B. Seuffert, A. C. Perez Grassi, T. Scheck, and G. Hirtz, “A Study on the Influence of Omnidirectional Distortion on CNN-based Stereo Vision,” in Proceedings of the 16th International Joint Conference on Computer Vision, Imaging and Computer Graphics Theory and Applications, VISIGRAPP 2021, Volume 5: VISAPP, Online Conference, Feb. 2021, pp. 809–816, doi: 10.5220/0010324808090816.

[2] J. Kannala, J. Heikkilä, and S. S. Brandt, “Geometric Camera Calibration,” in Wiley Encyclopedia of Computer Science and Engineering, B. W. Wah, Ed. Hoboken, NJ, USA: John Wiley & Sons, Inc., 2008.