Software-Entwicklung
Daten-Management
Beratung
Schulung
Support
LinguisticBits
Für Sprachwissenschaft(ler*innen)
KontaktÜber LinguisticBits
Service für Sprachwissenschaft(ler*innen)
LinguisticBits ist ein Geschäftsbereich der MusicalBits GmbH. LinguisticBits wird von Dr. Thomas Schmidt betrieben.
Nachdem ich 22 Jahre an Universitäten und außeruniversitären Forschungsinstituten Korpus-Software entwickelt, Forschungsprojekte geleitet, Korpus-Plattformen, Archive und Infrastruktureinheiten betrieben habe, bin ich der Ansicht, dass manche Aufgaben am besten von Forschungsprojekten an akademischen Einrichtungen angegangen werden, während andere besser an externe Dienstleister ausgelagert werden. LinguisticBits ist ein Partner für letzteres.
Die Mission von LinguisticBits ist eine effektive und effiziente Unterstützung von (Menschen in) Forschungsprojekten und Datenzentren in allen Belangen, die mit Korpora, Korpustechnologie und Korpusworkflows zu tun haben.
- Name:Dr. Thomas Schmidt
- E-Mail:thomas@linguisticbits.de
Services
Leistungen
Beratung
LinguisticBits berät Forschungsprojekte und Institutionen in Fragen des nachhaltigen Datenmanagements, der Wahl geeigneter Technologien und in anderen Aspekten der Arbeit mit Korpora.
Workflow-Entwicklung
LinguisticBits unterstützt bei der Einrichtung, Konfiguration und Optimierung von effizienten, effektiven und nachhaltigen Workflows für den Aufbau, die Erschließung, die Analyse und die Dissemination von Korpora.
Software-Entwicklung
LinguisticBits entwickelt Software für Dateneingabe, -konvertierung, -visualisierung und -analyse. Java und XML-Technologien sind unsere Spezialität, wir entwickeln auch in Python, C#, Javascript und R.
EXMARaLDA-Support und -Schulung
LinguisticBits bietet kompetenten und zuverlässigen Support für die EXMARaLDA-Tools. Wir bieten Support-Lizenzen für EXMARaLDA sowie Online- und Präsenz-Schulungskurse für EXMARaLDA.
Datenkuration
LinguisticBits generiert Mehwert für Korpusdaten, indem es sie konsistent und standard-konform macht, und mit automatischen Annotationsmethoden anreichert. Die Korpusdaten werden so bereit gemacht für die Analyse und/oder Veröffentlichung.
Forschungs-Partner
LinguisticBits arbeitet als Koooperationspartner von Forschungsprojekten, indem es bei der Konzeptualisierung von Anträgen und Arbeitsplänen mitarbeitet und Arbeitspakete übernimmt.
Über mich
Ausbildung und Erfahrung
Ausbildung
Ich habe Allgemeine Sprachwissenschaften, Mathematik, Englisch, Französisch, Künstliche Intelligenz, Informatik und Elektrotechnik an der Universität Kaiserlautern, der Johannes Gutenberg-Universität Mainz, der University of Edinburgh, der FU Berlin und der Université Paris VIII studiert (nicht in genau dieser Reihenfolge, siehe mein LinkedIn-Profil für Details). Ich habe einen Magister-Abschluss in Allgemeiner Sprachwissenschaft, einen European Master in Linguistics und ein Vordiplom in Mathematik und Informatik, Im Jahr 2004 wurde ich an der Universität Dortmund mit einer Arbeit zur Computergestützten Transkription promoviert (summa cum laude).
Erfahrung
Ich habe als wissenschaftlicher Mitarbeiter an der Universität Hamburg, dem Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim, der Universität Basel, der Berlin-Brandenburgischen Akademie der Wissenschaften und als Mitarbeiter bei Philips Speech Processing (Aachen) und der European Language Distribution Agency (ELDA, Paris) gearbeitet (auch dies nicht in genau dieser Reihenfolge, siehe mein LinkedIn-Profil für Details). Vor der Gründung von LinguisticBits habe ich als Freelancer Aufträge für Texas Instruments, CASIO, für die Freie Universität Bozen und die Universitäten Ghent, Olmütz, Düsseldorf, Duisburg-Essen, Hamburg, sowie für das Leibniz-Institut für Deutsche Sprache bearbeitet.
Ich habe ein Post-Doc-Jahr am International Computer Science Institute in Berkeley, Kalifornien verbracht und war Gastforscher and der Middle Eastern Technical University in Ankara sowie an der University of Texas in Austin.
Ich habe das Hamburger Zentrum für Sprachkorpora (HZSK) initiiert und war zwei Jahre lang dessen Geschäftsführer. Am Leibniz-Institut für Deutsche Sprache war ich zehn Jahre lang Leiter des Archivs für Gesprochenes Deutsch (AGD) und habe es im Ständigen Ausschuss Forschungsdateninfrastruktur des RatSWD vertreten.
Forschungsprofil
Ich habe mehr als 10 Forschungsprojekte geleitet (siehe Abschnitt 'Projekte' und habe über 100 wissenschaftlicher Artikel und Bücher auf den Gebieten der Korpuslinguistik und Computerlexikographie veröffentlicht (siehe mein ORCiD-Profil). Ich war und bin als Gutachter für zahlreiche Workshops, Konferenzen und Zeitschriften sowie für den DAAD, den Haut Conseil de l’évaluation de la recherche et de l’enseignement supérieur (Hcéres), den Schweizer Nationalfonds (SNF) und SwissUniversities und für das Ministerium für Bildung, Jugend und Sport der Tschechischen Republik tätig. Ich war oder bin Mitglied des wissenschaftlichen Beirats folgender Projekte: NITE, GeWiss, Camomile, KompAS, INEL, and Oral-History.Digital. Neben zahlreichen kleineren Workshops habe ich die GSCL-Konferenz 2011 in Hamburg organisiert und war Teil des Programmkomitees der 58. Jahrestagung des Leibniz-Instituts für Deutsche Sprache.
Skills
Ich bin Java-Entwickler auf Expertenniveau (senior/leader, Desktop und Server)
und Spezialist für XML und verwandte Technologien (XSLT, XPath etc.). Ich entwickle auch in Python und C#,
SQL und HTML/CSS/JavaScript. Ich bin der Lead Developer von
EXMARaLDA und
dem Kicktionary, und habe große Teile
der Datenbank für Gesprochenes Deutsch
und von ZuMult entwickelt.
Ich spreche und schreibe Deutsch, Englisch und Französisch.
LinguisticBits
- Name:Dr. Thomas Schmidt
- E-Mail:thomas@linguisticbits.de
Referenzen
Laufende und abgeschlossene Zusammenarbeiten
News
Aktuelles & Aktivitäten
Date(s) | Link(s) | |
---|---|---|
01 December 2024 | First official version of the ZuMult platform for the Texas German Dialect project online | Platform at UT Austin |
7/8 October 2024 | Workshop for the ALMA-B project at KU Eichstätt | |
27 June 2024 | Public beta version of the ZuMult platform for the Texas German Dialect project online | Platform at UT Austin |
5 June 2024 | New EXMARaLDA version online | Blog post |
May 2024 | Three EXMARaLDA workshops for a team of researchers at Universidade Federal de Minas Gerais, Brazil | |
13 March 2024 | EXMARaLDA workshop at UC Louvain-La-Neuve, part of séminaire "Récolte, nettoyage et enrichissement de corpus" | Seminar program |
31 January 2024 | Talk on 'Music, Artificial Intelligence and Linguistics' at University of Texas in Austin | Announcement |
14 November 2023 | 'Pioniergeist' Award for Musical Bits | LinkedIn post |
10/11 November 2023 | EXMARaLDA Workshop for the "Symposion Deutschdidaktik" at the University of Hildesheim | SDD website |
20 October 2023 | EXMARaLDA Support licences officially available | EXMARaLDA Blog post |
13 October 2023 | Talk "Getting ready for TGDA 2.0 – Enriching the Texas German Dialect Corpus for (comparative) corpus analyses" at German Abroad 5 | Conference website |
9 October 2023 | Data management workshop at German Abroad 5 | Conference website |
29 September 2023 | Keynote at Kick-off event "CLARIN-CH Working Group on sensitive data management" | Clarin.ch website |
15 September 2023 | Workshop on multimodality in CMC data at the International Conference on CMC and Social Media Corpora for the Humanities (Mannheim) | Conference website |
15 September 2023 | EXMARaLDA workshop for the International Graduate School German Jordanian University / PH Freiburg | GJU homepage |
12 September 2023 | Workshop "Annotation and Interoperability" for the Mezzanine project at the University of Maribor | Project homepage |
06 August 2023 |
New publication: Christian Fandrych, Thomas Schmidt, Franziska Wallner, Kai Wörner (eds.): Zugänge zu mündlichen Korpora für DaF und DaZ: Das ZuMult-Projekt. KorDaF (Korpora Deutsch als Fremdsprache). Jahrgang 3 • Ausgabe 1 • 2023 |
Journal page |
20 July 2023 | New official EXMARaLDA version | EXMARaLDA website |
14 July 2023 | EXMARaLDA workshop for the International Graduate School German Jordanian University / PH Freiburg | GJU homepage |
22 June 2023 |
Keynote: "Manual and automated, qualitative and quantitative approaches to spoken interaction" as a contribution to the workshop "Computational and Quantitative Approaches to Multimodal Video Analysis - CAMVA 2023" at the University of Zürich |
Workshop page |
23 May 2023 |
New publication: Marc Kupietz and Thomas Schmidt (eds.): Neue Entwicklungen in der Korpuslandschaft der Germanistik. Beiträge zur IDS-Methodenmesse 2022. Tübingen: Narr Francke Attempto. |
Publisher's page |
8 May 2023 | Corpus of Spoken Spanish in Equatorial-Guinea completed | Blog post |
05 March 2023 |
Republished in Open Access: Thomas Schmidt (2005/2023): Computergestützte Transkription - Modellierung und Visualisierung gesprochener Sprache mit texttechnologischen Mitteln. Dissertation (Universität Dortmund). Frankfurt a.M.: Peter Lang / Göttingen: Verlag für Gesprächsforschung. |
Publisher's page |
10 February 2023 |
Talk (with Hanna Hedeland): "Best Practices, Werkzeuge Workflows und Standards zur Erschließung audiovisueller Sammlungen" as a contribution to the workshop "“Hört, hört!” – Zum Umgang mit Audio in den DH" at the University of Wuppertal |
Workshop program |
6/7 February 2023 | Two-day EXMARaLDA training course at the University of Basel | EXMARaLDA page |
30 January 2023 |
New publication: Arnulf Deppermann, Christian Fandrych, Marc Kupietz and Thomas Schmidt (eds.): Korpora in der germanistischen Sprachwissenschaft Mündlich, schriftlich, multimedial. Band 2022 der Reihe Jahrbuch des Instituts für Deutsche Sprache. Berlin: de Gruyter. |
DeGruyter page |
13 January 2023 |
Talk: "Accéder aux corpus oraux: méthodes et technologies" as a contribution to the conference "Qu’est-ce que (se) représenter la parole ? Hommage à Gabriel Bergounioux" at the Université d'Orléans |
Workshop page |
23 December 2022 | EXMARaLDA Christmas Previews are online. | EXMARaLDA blog post |
12 December 2022 |
Lecture: "Mündliche Korpora - Manuelle und automatisierte Herangehensweisen an Gespräche und gesprochene Sprache" in the lecture series "Computer, Mensch, Sprache – interdisziplinäre Perspektiven an der Schnittstelle Sprachforschung/Informatik" at the University of Oldenburg |
Series program |
21 October 2022 | Evaluation results of the EXMARaLDA mini survey are online. | EXMARaLDA blog post |
Projekte
Forschungs- und Softwareprojekte
Kontakt
Kontaktieren Sie LinguisticBits
Adresse
LinguisticBits
MusicalBits GmbH
Nahestraße 28
D-55411 Bingen
thomas@linguisticbits.de
+49 6721 3096931