#erara hat zum 15jährigen Jubiläum ein paar neue Features bekommen: #NamedEntityRecognition #NamedEntityLinking und verbesserte Volltexterkennung.
three CLS INFRA Deliverables on #NLP are out now!
In this video Tess Dejaghere and Pranaydeep Singh of Ghent University CDH explain and demo work on #NER (#NamedEntityRecognition), #ABSA (Aspect-based #SentimentAnalysis) and #RelationalExtraction.
https://youtu.be/RJE83eb7a6A
Panel: More than Chatbots: Multimodal Large Language Models in Humanities Workflows
At #DHd2025, Nina Rastinger explores how well #AI handles abbreviations & NER:
NER works well, even with small, low-cost models
Abbreviations are tricky—costs & resource demands skyrocket
GPT o1 improves performance, even on abbreviations, but remains resource-intensive
Balancing accuracy & efficiency in text processing remains a challenge!
We are happy to announce that we just published our first preprint on arXiv: "NER4all or Context is All You Need: Using LLMs for low-effort, high-performance NER on historical texts. A humanities informed approach".
http://arxiv.org/abs/2502.04351
It is also our first endevour into collaborative work with such a large number of collaborators & contributors from the Chair of Digital History, NFDI4Memory's Methods Innovation Lab, & AI-Skills.
ReadMe2KG: Github ReadMe to Knowledge Graph #Challenge has been published as part of the Natural Scientific Language Processing and Research Knowledge Graphs #NSLP2025 workshop co-located with #eswc2025. This #NER task aims to complement the NDFI4DataScience KG via information extraction from GitHub README files.
task description: https://nfdi4ds.github.io/nslp2025/docs/readme2kg_shared_task.html
website: https://www.codabench.org/competitions/5396/
@eswc_conf @GenAsefa @shufan @NFDI4DS #NFDIrocks #knowledgegraphs #semanticweb #nlp #informationextraction
Wir haben im Rahmen eines Projekts den Nachlass Joseph von #Laßberg digitalisiert, mit #eScriptorium Volltexte erzeugt und noch #NER mit spaCy (als Forschungsdaten) und Googles NL gemacht. Spannendes Projekt, oft festgestellt, dass Open-Source-Alternativen noch nicht so weit sind und viele Übersetzungsschritte brauchen. Trotzdem erfolgreich fertiggestellt. Steht jetzt öffentlich zur Verfügung.
Named Entry Recongition ist eine computergestützte Methode zur Erkennung und Klassifizierung von Eigennamen in Texten. Bei historischen Texten ergeben sich besondere Herausforderungen für NER, z.B. durch nicht-standardisierte Schreibweisen.
Selina Galka hat versucht, eigene #NER Modelle für die Memoiren der Gräfin von Schwerin zu trainieren. Die Ergebnisse sind gemischt:
#NER, aber prompto!
Im morgigen #DigitalHistoryOFK demonstrieren Torsten Hiltmann, Martin Dröge & Nicole Dresselhaus (HU Berlin, #4Memory) am Bsp. des Baedeker-Reiseführers von 1921 die Potenziale von #LargeLanguageModels & prompt-basierten Ansätzen für die #NamedEntityRecognition in historischen Textquellen.
Offen für alle!
Wann? Mi., 26.06., 4-6 pm, Zoom
Abstract: https://dhistory.hypotheses.org/7870
____
#DigitalHistory #promptoNER #LLM #genAI @nfdi4memory @histodons
Nächste Woche startet wieder das #DigitalHistoryOFK
Wir freuen uns, auch für das SoSe 24 wieder ein vielfältiges Programm präsentieren zu dürfen.
Mit dabei sind Vorträge zu #NFDI4Memory, #DataFeminism, #NER mit #LLMs, #MedievalHistory, #DataLiteracy, #MediaHistory & vielem mehr!
Zum Programm: https://dhistory.hypotheses.org/digital-history-forschungskolloquium/programm-sommersemester-2024
Das Kolloquium findet via Zoom statt & ist offen für alle, die sich für #DigitalHistory & #DigitalHumanities interessieren.
Next: Harri Kiiskinen, Asko Nivala, Jasmine Westerlund, and Juhana Saarelainen (2023). “Extracting Geographical References from Finnish Literature. Fully Automated Processing of Plain-Text Corpora”. In: Journal of Computational Literary Studies 2 (1). doi: https://doi.org/10.48694/jcls.3584.
Keywords: named entity recognition, geographic information system, #geoparsing linked open data, literary geography, #Finland
For science nerds, there’s what looks like a really good series of presentations from The World Science Festival in 3 parts coming up today at 4pm on YouTube.
I have really enjoyed previous WSF videos and this one sounds really exciting.
https://youtu.be/P8pC_yehPH0?si=DsziFvjRlf9Zdmkq
Beyond Einstein:
Gravitational Rainbows
Gravitational Echoes
Gravitational Geysers
Hello
we are four Belgian Federal Scientific Institutes that want to share FAIR data about Entities related to Belgian Cultural Heritage by the end of 2026.
Here you will find multilingual updates on our project!
More Info https://www.kbr.be/en/projects/metabelgica/
https://github.com/metabelgica
https://zenodo.org/communities/metabelgica
Please spread the word and follow us!
How could you parse ingredients in a recipe? We could burn a bunch of energy using an LLM or, as I show in this blog post, we could use #spacy to build a robust and efficient little parser that could be replaced with an #ner model later. More fun with #gastronaut - my WIP, #django based #activitypub recipe app https://brainsteam.co.uk/2023/11/19/parsing-ingredient-strings-with-spacy-phrasematcher/
Ein Quellentext ist fertig transkribiert, jetzt beginnt normalerweise die mühsame Arbeit der Editoren zur Textaufbereitung: Lassen sich Personen und Orte nicht einfach automatisch erfassen?
https://grandtourdig.hypotheses.org/949
Maximilian Görmar im Blog Grand Tour digital zu Versuchen mit Named Entity Recognition am Reisebericht eines Apothekers.
Auf den Spuren der #LostAuthors:
Im heute veröffentlichten Paper zur #DigHis23 demonstriert @monicab wie digitale Methoden wie #TextReuse und #NER eingesetzt werden können, um zu erforschen, wie antike Autoren Historiker erwähnten & zitierten. Ein besonderer Fokus lag dabei auf der Identifikation solcher Historiker, deren Werke nur noch fragmentarisch erhalten sind.
Zum Paper: https://doi.org/10.5281/zenodo.8322062
Accompanying my colleagues' presentation "Entity linking historical document OCR by combining Wikidata and Wikipedia" on #SWIB23 today, we published our three Named Entity Disambiguation & Linking models on Hugging Face (de/en/fr) at https://huggingface.co/SBB as well as three accompanying training databases on Zenodo:
https://doi.org/10.5281/zenodo.7767403 (de)
https://doi.org/10.5281/zenodo.7773986 (en)
Definitivamente podemos mejorar muchísimo la calidad de la atención médica con estas estrategias. #NER#HER#QOFMEDICALCARE
#PCM20241
https://towardsdatascience.com/medical-text-analytic-techniques-and-its-applications-c7419c7c1f6