빅카인즈는 언론사와의 협약에 따라 매체별로 서비스 기간이 다릅니다. 동아일보, 조선일보의 경우는 2018년 이후 기사만 제공됩니다. 자세한 매체별 서비스 기간은 빅카인즈 소개 > 수집 기사 정보 > 수록기사에서 확인하실 수 있습니다.
빅카인즈 수록 기사의 기준은 언론사별로 결정하고 있어 동일하지 않습니다. 경우에 따라 온라인 기사를 보내는 언론사, 지면 기사를 보내는 언론사, 두 가지를 혼용해서 보내는 언론사가 있습니다.
다만 온라인과 지면 기사가 동일한 경우, 동일한 기사를 중복해서 전송하지 않도록 언론사에 요청하고 있습니다.
형태소 검색식에서 띄어쓰기는 AND의 의미와 같습니다. 즉, 검색창에 '청소년 교육'이라고 입력하고 검색어 처리를 '형태소 분석'으로 두시면 '청소년'과 '교육'이 모두 포함된 뉴스를 찾습니다.
기본적으로 뉴스 업로드 일시는 언론사에서 빅카인즈로 뉴스를 전송할 때 설정한 값을 활용하고 있습니다. 다만 언론사에서 늦은 저녁시간에 보내는 뉴스는 다음날로 지정하여 발행하는 경우가 있습니다. 또한 시간 정보가 누락되어 들어오는 뉴스의 경우에는 빅카인즈에서 수집된 시각을 기준으로 일시 정보를 생성합니다.
검색의 기본 설정값은 다음과 같습니다.
기간 : 3개월 언론사 : 전체 통합분류: 전체 분류 검색어 처리: 형태소 분석 검색어 범위: 제목 + 본문(부제목 포함) 기본 검색 정렬: ‘최신순’
빅카인즈 분석 결과를 활용하여 논문 작성 또는 도서 출판에 활용하는 경우, 별도의 허가 없이 해당 자료의 출처를 '한국언론진흥재단 빅카인즈' 또는 '한국언론진흥재단 빅카인즈(www.bigkinds.or.kr)'로 밝혀주시면 됩니다.
다만 빅카인즈에서 얻은 결과 중 '기사의 본문'을 일부라도 인용하시는 경우에는 저작권 구매 후 사용 가능합니다(관련 문의 : 뉴스저작권팀 02-2001-7792).
분석에서 제외되는 기사는 크게 ‘중복’과 ‘예외’로 나뉘어져 있습니다. 각각의 항목에 대한 설명은 다음과 같습니다.
중복: 유사도가 높아 기사가 반복적으로 수집되는 경우 예외: 인사, 부고, 동정, 포토 등 유의미한 분석결과를 기대하기 어려운 경우
검색된 뉴스가 분석대상 건수보다 많을 경우 정확도가 높은 뉴스부터 순서대로 분석을 진행합니다. 예를 들어 1,200건의 검색결과에서 분석 뉴스 건수를 1,000건으로 설정하면, 검색된 1,200건의 뉴스 중 정확도 순으로 추출한 1,000건의 뉴스를 대상으로 연관어 분석을 진행합니다.