Home > Patent > [책] 특허분류와 한국표준산업분류의 연계표 작성에 관한 연구

[책] 특허분류와 한국표준산업분류의 연계표 작성에 관한 연구

2008년에 특허청 연구과제로 작성한 보고서입니다. 이전에는 한국표준산업분류(KSIC)와 국제특허분류(IPC)를 포괄적으로 연결시킨 사례를 찾아볼 수 없었습니다. 비록, 이 연계표(확률표)의 정확도를 평가하기는 어려우나, 현재로서는 KSIC 체계에 대량의 특허 자료를 연결시킬 수 있는 유일한 도구일 것입니다.

한 가지 특이한 것은 확률표 작성을 위해 텍스트 마이닝을 이용했다는 점입니다. 산업분류와 특허분류를 연결시키기 위한 방법으로 텍스트 마이닝을 사용한 것은 이 연구가 최초가 아닐까 싶습니다. 이 과정에서 한국특허정보원 김명선 연구원으로부터 많은 도움을 받았습니다.

확률표를 작성하는 과정에 대부분의 노력과 시간을 투입하다 보니, 막상 보고서는 읽기 불편하고, 부족함이 많습니다. 이번 연구결과의 핵심은 보고서가 아니라 확률표라는 점을 변명으로 삼겠습니다. 이번 연구과정에서는 확률표를 손쉽게 사용할 수 있도록 간단한 변환 소프트웨어도 만들었습니다.

[보고서 내려받기]

※ 분류 간 연계(수치변환) 소프트웨어

1. 아래에 링크되어 있는 파일을 받습니다. (pat_ind_concord.zip)

2. 압축을 풀면 ‘match_dlg.exe’ 파일이 있습니다. 이것이 실행파일이며 설치과정은 필요없습니다.

3. 2번의 파일을 실행시켜 소프트웨어 화면에서 보여지는 순서에 따라 진행하시면 IPC별 특허출원 수를 산업분류별 특허출원 수로 변환하실 수 있습니다.

4. 변환을 원하시는 원데이터 파일(입력자료)는 아래에 함께 링크되어 있는 ‘sample.txt’ 파일과 같은 형태로 작성하셔서 사용하시면 됩니다. (필드간 구분자와 필드명(헤더)의 존재여부 등에 대해서는 소프트웨어에서 따로 설정하실 수도 있습니다)

5. 개별 분류간의 실제 연계확률이 궁금하신 분은 압축파일에 들어있는 ‘ProbabilityTable_FinalTable3.txt’ 파일을 참고하십시오. 이 파일이 특허분류와 산업분류의 연계확률 데이터 파일입니다.

[소프트웨어 내려받기]

[입력파일 샘플]

Advertisements
Categories: Patent
  1. No comments yet.
  1. No trackbacks yet.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: