TU BRAUNSCHWEIG
| Carl-Friedrich-Gauß-Fakultät | Informatik
Informatikzentrum

Textplagiaterkennung im Asiatischen Sprachraum

Bearbeiter (anonym, Login erforderlich)
Betreuer Dr. Martin Gutbrod
Professor Prof. Dr.-Ing. Lars Wolf
IBR Gruppe VS (Prof. Fischer)
Art Studienarbeit
Status abgebrochen

Mit der Nutzung des Internets zur Recherche und als Informationsquelle wird das wörtliche Kopieren ganzer Textbereiche sehr einfach, da Texte bereits in digitaler Form vorliegen. Mit Docol©c [1] wurde am IBR ein webbasiertes Softwarewerkzeug entwickelt, das Textplagiate erkennt und entsprechende Stellen im Text markiert. Allerdings ist dieses Werkzeug auf westliche und somit Buchstaben basierte Schriftsprachen ausgelegt, was mit Blick auf den riesigen asiatischen Sprachraum ein klarer Nachteil ist.

Die Aufgabenstellung der Studienarbeit umfasst folgende Punkte:

  • Welche tatsächliche Relevanz besitzen Textplagiate durch Copy & Paste an Chinesischen Schulen und Hochschulen und wie wird damit umgegangen. Welche kulturellen, sozialen und eventuell rechtlichen Gepflogenheiten sind dabei zu beachten?
  • Die Docol©c-Software verwendet zur Verarbeitung den UTF-8 Zeichensatz und kann somit theoretisch mit asiatischen Schriftzeichen umgehen. Wie gut jedoch werden Plagiate bei Schriftzeichen-Texten erkannt? Hier sollen umfangreiche Tests durchgeführt werden.
  • Docol©c verwendete spezielle Algorithmen zur Plagiatsuche für westliche Sprachen. Ausgehend von den Versuchsergebnissen und der Analyse der Algorithmen soll untersucht werden, welche Anpassungen/Besonderheiten bei asiatischen Sprachen zu beachten sind.
  • Die bereits vorhandene Mehrsprachigkeit von Docol©c wird durch spezielle Lokalisierungsklassen bereitgestellt. Hier sind entsprechende Anpassungen an den chinesischen Sprachraum zu tätigen.

Nach Rücksprache können eventuell auch nur einzelne Teile bearbeitet werden oder die Bearbeitung erfolgt im Team aus zwei Studenten/innen.


aktualisiert am 09.02.2015, 14:13
printemailtop