ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://zasobynauki.pl/zasoby/83189Link do zasobu (repozytorium):
https://id.e-science.pl/records/83189Metadane zasobu
| Tytuł |
Technical Contradictions extracted from patent documents |
|---|---|
| Osoby |
Autorzy:
Marek Mysior
Partner: Politechnika Wrocławska |
| Opis |
This dataset contains 141 Technical Contradictions extracted from .pdf files of 20 patents, using four Large Language Models: claude-sonnet-4, gpt-4.1, qwen3:32b and llama3.3:70b. Each extracted Technical Contradiction was manually assessed as either correct, or not (123 correct in total). Also, for each contradiction, a hallucination label (0/1) is provided, whether the contradiction can be inferred from the patent document (0) or not (1). Additionally, a .md file containing the prompt used in the extraction process as well as the JSON schema for the structured output is provided in .json The dataset was created as a result of the research project titled: "Analysis of the effectiveness of Large Language Models (LLM) in identifying technical contradictions", funded by the National Science Centre, Poland, grant no.: 2024/08/X/ST8/00391. Results for open-source models were obtained using resources provided by the Wroclaw Centre for Networking and Super- computing http://wcss.pl. (Angielski) Opis w innym języku: Ten zbiór danych zawiera 141 Sprzeczności Technicznych wyodrębnionych z plików .pdf 20 patentów przy użyciu czterech dużych modeli językowych: claude-sonnet-4, gpt-4.1, qwen3:32b oraz llama3.3:70b. Każda wyodrębniona Sprzeczność Techniczna została oceniona ręcznie jako poprawna lub niepoprawna (łącznie 123 poprawne). Dodatkowo, każdej sprzeczności przypisano etykietę halucynacji (0/1), wskazującą, czy sprzeczność wynika bezpośrednio z treści dokumentu patentowego (0), czy też nie (1). Udostępniono również plik .md zawierający prompt użyty w procesie ekstrakcji oraz plik .json z definicją schematu strukturalnego wyjścia. Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl. (Polski) Uwagi: Zbiór danych powstał w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano z wykorzystaniem zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego http://wcss.pl. |
| Słowa kluczowe | "Patent"@pl, "patent"@en, "TRIZ"@en, "TRIZ"@pl, "contradiction"@en, "llm"@en |
| Klasyfikacja |
Typ zasobu:
zbiór, baza danych Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018) Grupa docelowa: przedsiębiorcy, naukowcy Szkodliwe treści: Nie |
| Charakterystyka |
Miejsce powstania: Politechnika Wrocławska
Czas powstania: 2025 Liczba rekordów danych: 141 Język zasobu: Angielski |
| Licencja | CC BY 4.0 |
| Informacje techniczne |
Deponujący: Marek Mysior Data udostępnienia: 29-09-2025 |
| Kolekcje | Kolekcja Politechniki Wrocławskiej |
Podobne zasoby
Rozproszone systemy dystrybucji biogazu. Badania, projektowanie i rozwój
Sebastian Koziołek, Andrzej Białowiec, Marek Mysior, Mateusz Słupiński, Mariusz Ptak, Damian Derlukiewicz, książka, Politechnika Wrocławska, dziedzina nauk technicznych / energetyka (2011)
TRIZ Future Conference 2016
wideo, Politechnika Wrocławska, materiały popularnonaukowe i inne (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)
Technical Contradictions extracted from patent documents
Marek Mysior, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)