Farbfilter, englische Übersetzungen und Platzhalter: neue Features und Inhalte

Lesezeit: 8 Min.

Abschnitt Platzhalter, aktualisiert am 8.9.2022

Grosse Neuerungen stehen an! Bei den Funktionalitäten konnten wir die Navigation verbessern und damit einige Nutzer/-innenwünsche erfüllen, u. a. auch aufgrund der Nutzer/-innenumfrage zur Suche auf E-Pics von Mai 2022. Der Bericht zur Umfrage ist in Vorbereitung. Bei den Inhalten gibt es vielfältigste und sehr coole Neuerungen:

  1. Informationen zu den einzelnen Feldern
  2. Feld „Originaltitel“
  3. maschinell erzeugte Übersetzungen ins Englische
  4. Metadaten von nicht-digitalisierten Bildern (Platzhalter)
  5. Farbfilter („Farbenauswahl“, Auswahl von Bildern aufgrund ihrer Farbzusammensetzung)
  6. Entfernen der Swissnames aus der Volltextsuche.

a) Neue Funktionalitäten (AWP V14)

Im Juni 2022 haben wir die neueste Version (V14) unseres Webfrontends (AWP) geladen. Die wichtigsten Neuerungen stellen wir heute vor.

1) Seitenzahlangabe in der Ergebnisansicht (GoTo)

Beim Blättern zwischen den Seiten kann neu eine Seite angegeben werden (GoTo). Diese Funktion ist vor allem sehr hilfreich, wenn man grosse Sammlungen durchgehen möchte. Einige Crowdsourcer/-innen arbeiten so. Nach einem Unterbruch kann man bequem auf der Seite einsteigen, wo man aufgehört hat. 

Die GoTo-Funktion finden Sie jeweils unten rechts, wenn Sie in der Sammlungs-/Ergebnisansicht sind. Klicken Sie einfach auf die linke Zahl, die gewünschte Zahl eingeben und Enter drücken. 

NB: Die Funktion ist noch nicht ganz so wie wir uns wünschen: wir hoffen, dass das GoTo mit dem nächsten Update auch oben rechts auf der Seite angezeigt wird. So könnte man sich mühseliges Nach-unten-Scrollen ersparen. Die Techniker/-innen sind informiert, wir bleiben dran.

2) Seitenzahlangabe in der Einzelbildansicht (GoTo)

Dasselbe Prinzip funktioniert auch in der Einzelbildansicht. Sei es in Informations-Ansicht (i) oder in der Grossen Voransicht (Bild). 

3) Datenzählung in den Kategorien

Wir haben die Datenzählung bei den Kategorien aktiviert. Das heisst, jetzt passen sich die Kategorien bei der Suche an. Dadurch werden auch die Unterkategorien angezeigt. Die Anzahl Bilder einer Kategorie wird zudem in runden Klammern angezeigt.

Dies kann bspw. bei einer Stichwortsuche („Oise“) hilfreich sein.

Etwas Geduld ist allerdings gefragt, bis das System jeweils die genaue Anzahl zum Suchbegriff ausgibt. Kategorien ohne Treffer werden hellgrau mit „(0)“ angezeigt.

Frage an die Nutzer/-innen

Was ist Ihnen wichtiger:

  • Mehr Information durch die Anzeige der Treffer (Datenzählung) auf Kosten der Performanz?
  • Eine gute Datenbank-Performanz (ohne Datenzählung)?

Probieren Sie es aus und geben Sie uns Feedback an: bildarchiv@library.ethz.ch.

Ein Treffer mit „Oise“, z. B. im Genre Architekturfotografien (siehe unten) liefert Bilder, die Oise in einem Wort des Titels enthalten: „Pinte neuchatelOISE“. Es wird aber nicht nur das Titelfeld abgesucht, sondern wie immer bei einer Stichwortsuche, alle anderen Felder auch.

Wenn man nun „Oise“ auf den ersten Blick nicht in den Metadaten entdeckt, ruft man am besten die Informationsansicht auf und sucht mit CTRL+F nach „Oise“. Der Treffer kann durchaus auch in den Kommentaren stehen.

4) Kategoriensuche

Wie bisher werden bei einer Kategoriensuche alle Kategorien angezeigt, in denen „Oise“ vorkommt.  Die Kategorien werden leider nicht mit dem Kontext angezeigt. Mit Mouseover wird dann aber zumindest ersichtlich, wo im Kategorienbaum eine Kategorie angesiedelt ist.

Im Beispiel nochmals „Oise“. Klickt man auf eine angezeigte Treffer-Kategorie werden alle Bilder aufgerufen.

Leider ist es nicht möglich, direkt in den Kategorienbaum zu wechseln und sich die ganze Kategorien-Hierarchie aufklappen lassen. Dazu muss man die Recherche löschen, den Kategorienbaum anzeigen und alle Unterkategorien händisch aufklappen… 

NB: Dieses Desiderat ist bei unseren Techniker/-innen deponiert.

5) Kategorien: ALT- und CTRL-Taste 

Noch ein kleiner Benutzungstipp. Beim Einrichten dieser neuen Funktionalitäten ist dies unserer Technikerin quasi „über den Weg gelaufen“.

Wenn man auf das Plus vor den Kategorien klickt und gleichzeitig die ALT-Taste gedrückt hält, werden gleich zwei Ebenen unterhalb der jeweiligen Kategorie geöffnet. Sonst ist es nur eine. Damit spart man sich schon wieder ein paar Klicks…

Mit CTRL-Taste können gleichzeitig mehrere Kategorien ausgewählt werden. Allerdings werden die Kategorien automatisch mit AND gesucht. Das heisst man bekommt „sowohl als auch“ und damit in den meisten Fällen wohl zuviele Treffer. 

Alle Hinweise zur Suche in E-Pics finden Sie übrigens hier.

b) Neue Inhalte 

1) Informationen zu den meisten Feldern

Neu können wir zu jedem Feld ein Informationsfeld anzeigen. Fahren Sie einfach mit der Maus über das kleine eingekreiste „i“, dann können Sie die Informationen lesen. Wir können allen Felder weiterführende Informationen hinterlegen, ausser bei „Schlagwörter“.

Gerne nehmen wir auch hier Vorschläge und Rückmeldungen von Ihnen entgegen.

2) Das Feld Originaltitel

Am 1. Januar 2018 haben wir im Hintergrund das Feld Originaltitel eingeführt (siehe Screenshot oben). Hier wird der Titel, wie er im Ursprungszustand vorliegt und beim Inventarisieren erstmals erfasst wurde, wiedergegeben. Der Titel wird dabei telquel von der Vorlage abgeschrieben, sei dies vom Bild selber (Diarahmen, Rückseite eines Abzuges oder Verpackung u. ä.), sei dies von einem Katalog (Zettelkatalog oder digitale Datei) oder in den Metadaten (z. B. die IPTC-Felder) eines digitalen Bildes. Unsere Metadaten, insbesondere der Titel, sind ja sehr „volatil“, einerseits durch interne Überarbeitungen und andererseits durch die unzähligen Kommentare unserer fast unermüdlichen Crowd. Die Originalmetadaten sind in unseren Inventarlisten, das sind Excellisten, zwar dokumentiert, wurden aber bisher in E-Pics nicht angezeigt und waren für die Nutzenden also nicht nachvollziehbar. Das ändern wir jetzt. Im obigen Screenshot sehen Sie ein typisches Beispiel: in der Überlieferung waren keine Angaben zum Bild vorhanden. Dank den vielseitigen Hinweisen der Crowd (es war ein spannendes Hin- und Her, siehe Blogpost) entstand schliesslich der aktuelle Titel. Also von „Unbekannt, Schlucht mit Flusslauf“ zu „Flawil-Gossau, Stausee im Glatt-Tobel bei der Ruine Helfenberg“,

Wir werden übrigens bei „älteren“ Beständen wie alle LBS-Bilder die Originaltitel noch nachimportieren müssen. Leider können Sie nicht sehen, was bei uns „ältere“ Bestände sind…

3) Englische Übersetzungen 

Ein grosses Novum, auf das wir auch sehr stolz sind und das wir eigentlich schon seit 10 Jahren gerne gehabt hätten, sind die englischen Übersetzungen der Felder mit variablen Metadaten, das sind:

  • Titel
  • Beschreibung
  • Enthalten in
  • Kommentare

Die Felder mit fixen Metadaten (Farbe, Form, physische Beschreibung usw.), die Kategorien und auch die Bezeichnungen den Felder sind längst zweisprachig.

Seit Mitte März 2022 ist es möglich, dass wir die KI-basierte Übersetzungssoftware DeepLPro in unserem Backend integrieren und die Metadatenfelder maschinell übersetzen lassen können. Wir lassen seither jede Nacht das Programm laufen. Es betrifft alle Datensätze, das sind über eine Million. Pro Nacht können wir zwischen 3’000 und im Idealfall 10’000 Datensätze bearbeiten. Wir müssen dies nachts machen, da das Programm dafür sehr viele System-Ressourcen braucht, so dass weder wir im Hintergrund noch Sie im Vordergrund noch richtig arbeiten und recherchieren könnten. Alle Bilder, die online sind, sind nun übersetzt. Die Arbeit bei den Offline-Bildern läuft im Hintergrund weiter.

Unser bisherige Fazit zu den Übersetzungen mit DeepL ist:

  • Grösstenteils gute Übersetzungen 
  • Problematisch:
    • Ortsnamen wie Brunnen («Fountain»), Baden («Bathing») oder Speicher («Memory»)
    • Abkürzungen wie «v. S.», «v. N. O.» werden nicht erkannt
    • Schweizerische Begriffe wir ARA (Abwasserreinigungsanlage)
  • Ein Glossar kann hinterlegt werden
  • Jede Sprache muss einzeln übersetzt werden. Wir haben jetzt mal mit Deutsch begonnen…

Probieren Sie die Übersetzungen aus! Stellen Sie in E-Pics Bildarchiv die Sprache (oben rechts) einfach auf Englisch um. 

Weitere Informationen zum Einsatz der Künstlichen Intelligenz bei den Kategorien (Keywords/Schlagwörter) und zum Einsatz von DeepL siehe auch der Vortrag vom letzten Bibliothekartag in Leipzig (Folien).

4) Platzhalter

Aktualisierung: Am 7.9.2022 wurden die Platzhalter wieder offline genommen. Die vielen Datensätze ohne Bild haben zu grossen Missverständnissen geführt.

Ein weiteres, lange gehegtes Desiderat ist die Anzeige der Metadaten von nicht-digitalisierten Bildern. Das betrifft insbesondere den grossen Bestand der Comet-Pressebilder. Wir sind zwar seit 2015 am Digitalisieren einer grosszügigen Auswahl, aber es kann schon sein, dass die eine oder andere Reportage, die wir nicht digitalisieren, interessant sein könnte. Jetzt kann man also die Reportage auch selber finden und allenfalls eine Digitalisierung beauftragen. Was einen kleinen Unkostenbeitrag von CHF 20 pro Bild macht. 

Sie brauchen uns also nicht mehr zu fragen, sondern können selber recherchieren. Bei der Comet Photo AG sind das 63’714 zusätzliche Datensätze bei den Pressebildern! Wir starten vorderhand mit diesem Bestand, weitere Bestände werden folgen.

Das sieht nun folgendermassen aus (siehe Screenshot unten): Sobald Sie eine normale Recherche machen, erhalten Sie nun als Treffer auch die Datensätze ohne Bild, die sogenannten Platzhalter „Digitales Bild auf Anfrage“.

Wenn Sie diese Platzhalter nicht sehen wollen, dann einfach beim nun immer aufgeklappten Filter „mit Bild“ (auf der linken Seite) „mit Bild“ wählen. Wir haben es technisch leider (noch) nicht geschafft, den Filter „mit Bild“ defaultmässig aktiviert zu haben. Falls dies nicht möglich sein wird (und es sieht im Moment leider sehr danach aus), werden wir allenfalls uns etwas mit der Sortierung überlegen (Dateiformat zum Sortieren aktivieren). Wir halten Sie auf dem Laufenden!

Filtert man die Bilder nach „mit Bild“, dann erhält man die gewohnte Trefferansicht. Man kann aber natürlich auch nur in den Metadaten ohne Bilder recherchieren mit dem Filter „ohne Bild“.

5) Farbenauswahl

Eine weitere grosse Neuerung ist der Farbfilter „Farbenauswahl“. Per Metadaten beschreiben wir ja sowieso, ob ein Bild farbig, handkoloriert oder schwarz/weiss ist.

Nun haben wir mit der künstlichen Intelligenz (Software „Clarifai“), mit der wir bereits die Autotags erstellen lassen, bei allen Farbbildern mit der Colors-Funktion die Hauptfarben aus dem Bild herausziehen lassen. Clarifai zieht dabei maximal acht Farben aus einem Bild. Im Moment haben 530’225 Bilder mindestens eine Hauptfarbe, aber nur 1’334 Bilder haben acht Hauptfarben.

Auch dieser Job konnte jeweils nur nachts laufen. Die Farben sind vorletzte Woche fertig geworden, rechtzeitig auf das Go-Online also. 

Die Farben sind sehr genau definiert, die Liste ist also lang, und nach der Anzahl Bilder sortiert. Es sind immer die Hauptfarben eines Bildes, das können DarkSlateGrey (52’986) bis Medium Orchid (1).

Wir planen, diese Funktion demnächst auch im Katalog E-Pics Tiere, Pflanzen und Biotope anzubieten. 

6) Das Feld Swissnames

Auf vielfältigen Wunsch resp. Ärgerbekundungen in der eingangs erwähnten Nutzer/-innenbefragung ist das Feld „sMapshot Swissnames“ im Moment aus der Volltextsuche entfernt. Es erscheinen nun einiges weniger Treffer. Aber beim Beispiel „Zürich“ hat es immer noch viele Treffer, da „Zürich“ auch in der Kategorie „Kanton Zürich“ gefunden wird. 

Im Hintergrund haben wir zusammen mit sMapshot den Algorithmus des Footprints verbessert, nun müssen diese in sMapshot neu berechnet und dann wieder in die Bilddatenbank E-Pics integriert werden.

Teilen mit:

DOI Link: https://doi.org/10.35016/ethz-cs-22254-de

Neueste Beiträge

Neueste Kommentare

Archive

Meta

Schreibe den ersten Kommentar

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert