toad.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
Mastodon server operated by David Troy, a tech pioneer and investigative journalist addressing threats to democracy. Thoughtful participation and discussion welcome.

Administered by:

Server stats:

298
active users

#topicmodeling

1 post1 participant0 posts today

Interesse an #TopicModeling für historische Fachzeitschriften? Eike Löhden & ich haben 50 Jahrgänge der „Francia“ analysiert.

Wie haben sich Schwerpunkte über die Jahre entwickelt? Welche Unterschiede zeigen sich zwischen deutsch- und französischsprachigen Beiträgen? Und auch: Was bringt die Methode, wo liegen ihre Grenzen?

Bitte hier entlang => doi.org/10.11588/fr.2023.1.107

Wie funktioniert das Zusammenspiel von Topic Modeling und manueller Annotation bei der Erschließung umfangreicher qualitativer Forschungsdaten? Dieser Frage geht der neueste ZfdG-Artikel in einem experimentellen Setting nach: zfdg.de/2024_003

»Mensch und Maschine als Team. Exploratives Topic Modeling und manuelle Annotation in der qualitativen Sozialforschung« von Lina Franken und Dennis Möbus
#topicmodeling #dh #digitalhumanities #qualitativeforschung #kulturwissenschaft #oralhistory

📢 Nach dem Semester ist vor dem Semester:

Auch im kommenden Sommersemester bietet das Lehrangebot der #DigitalHistory an der HU Berlin wieder ein reichhaltiges Kursprogramm:

Von Vertiefungskursen zu #DataLiteracy sowie zum Programmieren mit #Python über gleichermaßen praxis- wie theorieorientierte Einführungen in #SentimentAnalysis & #TopicModeling bis hin zu historischen Grundwissenschaften & Bibliotheken im Kontext der #digiGW - da ist für jede:n was dabei!

ℹ️ hu.berlin/DigHisLehreSoSe24

Wie können wir mit digitalen Methoden preußische Verwaltungsdiskurse des 19. Jahrhunderts erschließen? 🔍

Felix Selgert & Alexander Ermakov zeigen in ihrem #DigHis23-Paper anhand verschiedener #TopicModeling-Algorithmen, wie die Verfahren zur Quellenerschließung und -analyse eingesetzt werden können.

🗞️ Zum Paper: doi.org/10.5281/zenodo.8428178

____
#DigitalHistory #DigitalHumanities #histodons #TextMining

ZenodoDer Verwaltungsdiskurs in der preußischen Regionalverwaltung im frühen 19. Jahrhundert. Eine Topicmodellierung der ImmediatzeitungsberichteEin Beitrag zur Digital History 2023: Digitale Methoden in der geschichtswissenschaftlichen Praxis: Fachliche Transformationen und ihre epistemologischen Konsequenzen, Berlin, 23.-26.5.2023. Abstract: Dieser Beitrag untersucht exemplarisch für den Regierungsbezirk Düsseldorf im Jahr 1817, welche latenten Berichtskategorien in den Immediatzeitungsberichten dieses rheinischen Regierungsbezirks vorhanden waren. Bei den Immediatzeitungsberichten handelt es sich um Verwaltungsberichte der preußischen Regierungen, die direkt an den König adressiert, und somit immediat, waren. Der Ursprung dieses Quellentyps liegt im 18. Jahrhundert, nach dem Wiener Kongress wurden die Berichte bis zum Ende der Monarchie auch aus den neuen preußischen Provinzen erstattet. Der Fokus des Beitrags liegt dabei auf der Erprobung unterschiedlicher Topicmodellarchitekturen (LDA, sLDA, CTM und HDP) und Textkompilationen für den Quellentyp Verwaltungsbericht. Die handschriftlichen Verwaltungsberichte werden zunächst mit Hilfe von Transkribus transkribiert, digitalisiert und nach einzelnen Berichtskategorien und Monaten als .txt-files exportiert. Danach werden die Texte entlang verschiedener Achsen (Berichtskategorie, Witterungsperioden, Jahr) zusammengefasst und die latenten Themen der Berichte mit Hilfe unterschiedlicher Topicmodelle identifiziert und miteinander verglichen. Für nach Berichtskategorien vorsegmentierte Texte ergeben LDA und sLDA Modelle die am besten interpretierbaren Topics, vorausgesetzt das Vokabular ist hinreichend groß und die zu erfassenden Strukturen sind genügend ausgeprägt. HDP Modelle sind dagegen bei den aus allen Texten eines Jahres zusammengesetzten Dokumenten besser dazu in der Lage, zumindest einen Teil der Berichtskategorien sowie klar hervorstechende Strukturelemente (bspw. tabellarische Preisangaben) zu erfassen.

If you are interested in how to apply #TopicModeling to continuously growing corpora, have a look at this talk by @rieger he gave last year in our lecture series:

zpid.cloud.panopto.eu/Panopto/

He shows the advantages of modeling growing text corpora using RollingLDA and presents some example applications, e.g., the uncertainty perception and inflation perception indicators, PsychTopics as well as various change detection and monitoring scenarios.