모델 입력으로서 뉴스-기반 이벤트 타임라인의 한계
뉴스 기반 이벤트 타임라인은 시공간 정밀도와 타임스탬프 정확성에서 관측 장비 데이터보다 떨어질 수 있다. 보도 지연, 보도 선택성(심각한 사건 위주 보도), 중복 보도, 위치 언어의 모호성 등이 노이즈를 유발하며, 모델에 그대로 투입하면 과적합 또는 잘못된 신호를 줄 위험이 있다. 따라서 실사용 전 교차검증(관측 데이터와의 정합성 확인), 보정 단계, 신뢰도 컷오프가 필수적이다.
출처
- [[260312_hanaglobalbottomup_8085_ref]] (원본 노트)