ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://zasobynauki.pl/zasoby/83188Link do zasobu (repozytorium):
https://id.e-science.pl/records/83188Metadane zasobu
| Tytuł |
Technical Contradictions extracted from patent documents |
|---|---|
| Osoby |
Autorzy:
Marek Mysior
Partner: Politechnika Wrocławska |
| Opis |
This dataset contains 141 Technical Contradictions extracted from .pdf files of 20 patents, using four Large Language Models: claude-sonnet-4, gpt-4.1, qwen3:32b and llama3.3:70b. Each extracted Technical Contradiction was manually assessed as either correct, or not (123 correct in total). Also, for each contradiction, a hallucination label (0/1) is provided, whether the contradiction can be inferred from the patent document (0) or not (1). Additionally, a prompt used to extract those contradictions is provided in .j2 format, including The dataset was created as a result of the research project titled: "Analysis of the effectiveness of Large Language Models (LLM) in identifying technical contradictions", funded by the National Science Centre, Poland, grant no.: 2024/08/X/ST8/00391. Results for open-source models were obtained using resources provided by the Wroclaw Centre for Networking and Super- computing (http://wcss.pl). (Angielski) Opis w innym języku: Ten zbiór danych zawiera 141 Sprzeczności Technicznych wyekstrahowanych z plików .pdf dwudziestu patentów, z wykorzystaniem czterech dużych modeli językowych (LLM): claude-sonnet-4, gpt-4.1, qwen3:32b oraz llama3.3:70b. Każda wyekstrahowana Sprzeczność Techniczna została poddana ręcznej ocenie pod kątem poprawności (łącznie 123 uznane za poprawne). Dodatkowo, dla każdej sprzeczności podano etykietę halucynacji (0/1), określającą, czy dana sprzeczność wynika bezpośrednio z treści dokumentu patentowego (0), czy też nie (1). Zbiór danych został opracowany w ramach projektu badawczego pt. „Analiza efektywności wykorzystania dużych modeli językowych (LLM) w identyfikowaniu sprzeczności technicznych”, finansowanego przez Narodowe Centrum Nauki, nr grantu: 2024/08/X/ST8/00391. Wyniki dla modeli open-source uzyskano przy wykorzystaniu zasobów Wrocławskiego Centrum Sieciowo-Superkomputerowego (http://wcss.pl). (Polski) |
| Słowa kluczowe | "Patent"@pl, "patent"@en, "TRIZ"@en, "TRIZ"@pl, "llm"@en, "sonnet"@en, "contradiction"@en |
| Klasyfikacja |
Typ zasobu:
zbiór, baza danych Dyscyplina naukowa: Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018) Grupa docelowa: przedsiębiorcy, naukowcy Szkodliwe treści: Nie |
| Charakterystyka |
Miejsce powstania: Politechnika Wrocławska
Czas powstania: 2025 Język zasobu: Angielski |
| Licencja | CC BY-SA 4.0 |
| Informacje techniczne |
Deponujący: Marek Mysior Data udostępnienia: 29-09-2025 |
| Kolekcje | Kolekcja Politechniki Wrocławskiej |
Podobne zasoby
Rozproszone systemy dystrybucji biogazu. Badania, projektowanie i rozwój
Sebastian Koziołek, Andrzej Białowiec, Marek Mysior, Mateusz Słupiński, Mariusz Ptak, Damian Derlukiewicz, książka, Politechnika Wrocławska, dziedzina nauk technicznych / energetyka (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)
TRIZ Future Conference 2016
wideo, Politechnika Wrocławska, materiały popularnonaukowe i inne (2011)
Technical Contradictions extracted from patent documents
Marek Mysior, zbiór, baza danych, Politechnika Wrocławska, Dziedzina nauk inżynieryjno-technicznych / inżynieria mechaniczna (2018)