Förderjahr 2024 / Projekt Call #19 / ProjektID: 7409 / Projekt: KomMKonLLM
Wir führen den Prozess zur Erzeugung kombinatorischer Konsistenztests anhand eines Beispiels im Detail durch!
Nach der Vorstellung der Methodik von KomMKonLLM (aufgeteilt auf einen ersten und zweiten Blog-Post), wollen wir nun ein konkretes Beispiel durchgehen, um die einzelnen Schritte im Methodik-Prozess von KomMKonLLM darzustellen.
Dazu betrachten wir folgende Ja/Nein-Frage: „Kann man im Winter in der Steiermark schifahren?“
In dieser Frage wählen wir nun die folgende drei Teile [1] zur Synonymersetzung aus:
- „im Winter“
- „in der Steiermark“
- „schifahren“
Als nächsten müssen wir uns Synonyme für diese Worte überlegen. Damit dieses Beispiel nicht zu umfangreich wird, werden wir jeweils nur ein Synonym auswählen. Und zwar:
- Als Synonym für “Winter” wählen wir (in entsprechender Deklination): „in der kalten Jahreszeit“.
- Als Synonym für Steiermark wählen wir (in entsprechender Deklination): „im grünen Herzen Österreichs“ [2].
- Als Synonym für “schifahren” wählen wir „skifoan“ [3].
Wir erhalten damit nun drei Synonymlisten, alle mit jeweils zwei Einträgen:
- SynList_Winter: „im Winter“, „in der kalten Jahreszeit“
- SynList_Steiermark: „in der Steiermark“, „im grünen Herzen Österreichs“
- SynList_schifahren: „schifahren“, „skifoan“
Im Sinne eines kombinatorischen Satzmodels haben wir nun drei Parameter mit jeweils zwei Werten. Dieses abstrakte Modell können wir nun in Software für kombinatorischen Testen als IPM erstellen. Im Folgenden verwenden wir das Tool CAgen, und ein Screenshot des IPMs in der Web-Version von CAgen sieht so aus:
Wir erzeugen nun eine paarweise-Fragemenge, das heisst, wir verwenden CAgen um ein abdeckendes Array (engl., covering array) der Stärke zwei zu erstellen:
Die kombinatorische Stärke zwei bedeutet nun, dass für jede ungeordnete Auswahl von zwei verschiedenen Spalten, jedes Paar an möglichen Parameter-Werten mindestens einmal auftritt. Weiters sei darauf hingewiesen, dass die Worte selbst in der ersten Zeile vorkommen. Wir wollen die Leserinnen und Leser dieses Blog-Posts ermutigen, das Auftreten aller anderen Werte-Paare auch zu überprüfen! 😉
Diese vier Zeilen im erzeugten Array werden nun wieder in Fragen umgewandelt, wobei die Array-Elemente in die Frage an die entsprechenden Positionen gesetzt werden. Dann erhält man, unter Beibehaltung obiger Reihenfolge der Zeilen, die folgenden Fragen:
- Kann man im Winter in der Steiermark schifahren?
- Kann man im Winter im grünen Herzen Österreichs skifoan?
- Kann man in der kalten Jahreszeit in der Steiermark schifahren?
- Kann man in der kalten Jahreszeit im grünen Herzen Österreichs skifoan?
Diese vier Fragen kann man nun an ein LLM stellen! Dabei ist zu beachten, dass ein entsprechender Prompt garantiert, dass man nur „Ja“ oder „Nein“ als einzige Antwort bekommt, um diese erhaltene Antwort dann auf einfache Weise maschinell weiterzuverarbeiten.
Probiert es doch mal selbst aus! 😊
In einem weiteren Blog-Post werden wir die in KomMKonLLM verwendeten Kombinatorik etwas genauer erklären.
[1] Der Einfachheit halber und um grammatikalisch korrekte Fragen zu erhalten, ersetzen wir in diesem Beispiel nicht nur Worte selbst, sondern auch ihre unmittelbare Satz-Umgebung.
[2] Die Terminologie wird – beispielsweise – von der Steirischen Tourismus und Standortmarketin GmbH-STG auf dem Webauftritt www.steiermark.com verwendet.
[3] Diese umgangssprachliche Schreibweise des Verbes “schifahren“ könnte in einem Chat bzw mobilen Messenger auf einem mobilen Endgerät geschrieben werden.
Bernhard Garn
Google Scholar: https://scholar.google.at/citations?user=Afk5HBQAAAAJ&hl=en&oi=ao
Bernhard Garn is a research scientist in applied mathematics; senior researcher at the MATRIS Research Group (https://matris.sba-research.org/) at SBA Research (https://www.sba-research.org/).
Research Interests
At the core of Bernhard’s research is the application of discrete mathematics, in particular design theory, to scientific fields. With his background in mathematics, he is especially interested in the application of theoretical results to practical problems, effectively bridging the gap between mathematics and application domains.
His research interests include combinatorial mathematics for software testing, mathematical aspects of information security as well as discrete mathematics for disaster research.
He has developed further the underlying discrete mathematical structures used in combinatorial testing for software from a theoretical perspective using combinatorial and computer algebra techniques. He has also applied combinatorial security testing to several major modern issues in information security, thereby covering different layers of the software stack. In particular, Bernhard has developed CST approaches for web security (XSS, SQLi) and the security and reliability of operating systems. In the domain of online privacy, he has demonstrated how combinatorial methods can be used for browser fingerprinting.
Bernhard is further interested in disaster research, ranging from natural, cyber disasters in critical infrastructure to financial disasters, with the goal of strengthening preparedness and resilience.
Bio
Bernhard received a Bachelor of Science and a Diplomingineur in Technical Mathematics, as well as a Doctoral degree in technical sciences (Informatics) from TU Wien.