Widok

Metadane zasobu

Tytuł	Korpus tekstów naukowych dla języka polskiego, cz.1
Osoby	Autorzy: Teresa Sas Partner: Politechnika Wrocławska
Opis	Korpus tekstów naukowych dla języka polskiego, utworzony na bazie zasobów DBC (prace habilitacyjne, artykuły naukowo-popularne). Korpus jest uporządkowanym zbiorem tekstów naukowych zapisanych w postaci elektronicznej, w formacie tekstowym umożliwiającym jego łatwe przetwarzanie w celach badawczych oraz wykorzystanie w aplikacjach praktycznych ze szczególnym wskazaniem na aplikacje związane z rozpoznawaniem mowy w języku polskim. Wszystkie słowa w korpusie są rozpisane literalnie, usunięta jest interpunkcja i znaki specjalne, daty i liczby są w postaci słownej, tekst został pofrazowany i otagowany znacznikami początku i końca frazy. Tak przygotowany korpus językowy umożliwia prowadzenie badań z zakresu rozpoznawania mowy, uczenia maszynowego, inżynierii języka naturalnego oraz lingwistyki. Unikalność tego zasobu polega na tym, że ukierunkowany jest on na słownictwo naukowe obejmujące nauki ścisłe, chemiczne, przyrodnicze i medyczne. (Polski) Uwagi: W pliku pdf opisano szczegółowo sposób tworzenia korpusu oraz podano listę dokumentów, które w nim uwzględniono.
Słowa kluczowe	"korpus językowy"@pl, "Uczenie maszynowe"@pl, "korpus języka polskiego"@pl, "korpusy tekstowe"@pl, "inżynieria języka naturalnego"@pl, "ASR"@pl, "automatyczne rozpoznawanie mowy"@pl
Klasyfikacja	Typ zasobu: zbiór, baza danych Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Grupa docelowa: ogół społeczeństwa, administracja publiczna, przedsiębiorcy, uczniowie, studenci, nauczyciele, naukowcy Szkodliwe treści: Nie
Charakterystyka	Miejsce powstania: Wrocław Czas powstania: 2020 Język zasobu: Polski
Powiązane zasoby	Korpus tekstów naukowych dla języka polskiego, cz. 2
Licencja	CC BY-SA 4.0
Informacje techniczne	Deponujący: Teresa Sas Data udostępnienia: 04-11-2020
Kolekcje	Kolekcja Politechniki Wrocławskiej, Kolekcja e-Science PWr

Cytowanie

Skopiowano

Teresa Sas. Korpus tekstów naukowych dla języka polskiego, cz.1. [zbiór, baza danych] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Splunk - konfiguracja, rozpoznawanie i wizualizacja informacji o incydentach i zagrożeniach

Arkadiusz Kotynia, Julia Jancelewicz, Urszula Warmińska, inny dokument, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / automatyka, elektronika i elektrotechnika (2018)

Forming and pruning one-class classifier ensembles

Bartosz Krawczyk, praca dyplomowa, Politechnika Wrocławska, dziedzina nauk technicznych / elektronika (2011)

Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 8

Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)

Eksperymenty z ujednoznaczniania znaczeń leksykalnych

Arkadiusz Janz, Paweł Kędzia, zbiór, baza danych, Politechnika Wrocławska, dziedzina nauk technicznych / informatyka (2011)

Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 16

Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)

Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 23.

Teresa Sas, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)

Zobacz więcej