REPORT A PROBLEM
LINKS
Resource link (short)
http://zasobynauki.pl/zasoby/53293Resource link (repository)
https://id.e-science.pl/records/53293Resource metadata
Title |
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 1 |
---|---|
Persons |
Authors:
Teresa Sas
Partner: Wrocław University of Science and Technology |
Description |
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim. Jest to zbiór nagrań zapisanych w postaci standardowych plików audio, uzupełniony o ich transkrypcję tekstową. Zbiór został odpowiednio usystematyzowany i skatalogowany, oznaczona została płeć mówcy. Podzielony został na nagrania wykonane w trybie nadzorowanym, gdzie mówca czytał dostarczony mu tekst oraz nagrania nienadzorowane, spontaniczne, zapisy audio wywiadów i wystąpienia konferencyjne pracowników naukowych rejestrowane na żywo. Dodatkowo oznaczone zostały tak zwane nagrania zakłócone, czyli nagrania wykonane w trudnych warunkach akustycznych, ze słyszalnym pogłosem, muzyką w tle lub dużą ilością artefaktów typu y, yyy, e, eee, m, mmm, hmh. Tak przygotowany korpus może być wykorzystany zarówno do budowy modeli akustycznych dla systemów rozpoznawania mowy dla języka polskiego jak i stanowić bazę do prowadzenia badań naukowych z zakresu sztucznej inteligencji, rozumienia mowy, uczenia maszynowego, sieci głębokiego uczenia i wielu innych zagadnień naukowych związanych z inżynierią języka naturalnego. (Polish) Comments: W pliku pdf opisano szczegółowo sposób tworzenia korpusu oraz podano listę dokumentów, które w nim uwzględniono. |
Keywords | "model"@pl, "korpus nagrań próbek mowy"@pl, "model akustyczny"@pl, "automatyczne rozpoznawanie mowy"@pl, "rozpoznawanie mowy"@pl, "rozumienie języka naturalnego"@pl, "anotacja korpusu"@pl |
Classification |
Resource type:
dataset, database Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018) Destination group: general public, public administration, entrepreneurs, pupils, students, teachers, scientists Harmful content: No |
Characteristics |
Place of creation: Politechnika Wrocławska
Creation time: 2020 Resource language: Polish |
License | CC BY-SA 4.0 |
Technical information |
Submitter: Teresa Sas Availability date: 16-11-2020 |
Collections | Kolekcja Politechniki Wrocławskiej, Kolekcja e-Science PWr |
Citation
Teresa Sas. Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 1. [dataset, database] Available in Atlas of Open Science Resources, . License: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Date of access: DD.MM.RRRR.
Similar resources
Wytyczne KPWr - Wytyczne do znakowania relacji semantycznych i składniowych we wnętrzu fraz NP i AdjP. Wersja RRG
Paweł Kędzia, Marek Maziarz, Marcin Oleksy, other document, Wrocław University of Science and Technology, dziedzina nauk technicznych / informatyka (2011)
Model mikrosystemu do pomiaru absorbancji z mikroprzepływowym mieszalnikiem spiralnym
Witold Nawrot, 3D, photo360, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / automatyka, elektronika i elektrotechnika (2018)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 8
Teresa Sas, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 21
Teresa Sas, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 20
Teresa Sas, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Korpus nagrań próbek mowy do celów budowy modeli akustycznych dla automatycznego rozpoznawania mowy w języku polskim, cz. 17
Teresa Sas, dataset, database, Wrocław University of Science and Technology, Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)