Google 독감 트렌드로 인플루엔자 추적

독감에 관한 정보가 아플 때 사람들이 정보를 검색한다는 것은 놀라운 일이 아닙니다. Google은 이러한 추세를 활용하여 지역별로 독감 유행을 예측하는 방법을 모색했습니다. 그들은 검색 트렌드 데이터가 실제로 독감 발발 추적의 전통적인 CDC (Center for Disease Control) 방법보다 약 2 주 더 빠르다는 것을 발견했습니다.

Google 독감 트렌드는 미국에서 현재 발생하고있는 규모를 추정하거나 상태별로 분류합니다. 지난 몇 년간의 트렌드를보고 근처의 독감 예방 주사를 찾을 수있는 곳을 검색 할 수도 있습니다.

빅 데이터

Google 독감 트렌드는 기존 방식을 사용하여 검토하기에는 너무 크고 복잡 할 엄청난 규모의 구조화 된 또는 비정형 데이터 세트를 설명하는 데 사용되는 용어 인 '빅 데이터'를 사용하여 수행 할 수있는 발견의 한 예입니다.

기존의 데이터 분석에는 일반적으로 수집 한 내용을 관리 가능한 크기로 유지하는 것이 포함되었습니다. 연구자들은 큰 집단에 대한 정보에 근거한 추측을하기 위해 매우 큰 집단의 작은 통계 표본을 사용했다. 예를 들어, 정치적 투표는 상대적으로 적은 수의 사람들을 호출하고 질문을함으로써 이루어진다. 샘플링이 더 큰 그룹 (예 : 매사추세츠의 모든 유권자)과 유사한 경우 소그룹의 설문 결과를 사용하여 더 큰 그룹에 대한 추측을 할 수 있습니다. 매우 깨끗한 데이터 세트가 필요하며 검색 대상을 알고 있어야합니다.

반면에 빅 데이터는 최대한 큰 데이터 세트 (예 : Google의 모든 검색어)를 사용합니다. 큰 데이터 세트를 사용하면 불완전한 항목, 키보드를 통해 걷는 고양이 검색 항목 등등과 같은 "지저분한"데이터도 생깁니다. 괜찮아. 대대적 인 데이터 분석은이를 고려하여 여전히 발견되지 않은 결론을 이끌어 낼 수 있습니다.

이러한 발견 중 하나는 Google 독감 트렌드였습니다. Google 독감 트렌드는 독감 증상에 대한 검색 쿼리가 급증한 것을 확인합니다. 당신은 항상 Google이 아닙니다. "이봐 요, 나는 독감에 걸렸습니다. OK Google, 근처에 의사가 있습니까?" 당신은 "두통과 열"같은 것을 찾는 경향이 있습니다. 매우 지저분하고 큰 검색어 집합의 약간의 상승 추세는 Google 독감 트렌드의 힘입니다.

이것은 독감이 CDC보다 빨리 발견되기 때문에 참신한 것 이상입니다. CDC는 의사 및 병원의 긍정적 인 독감 검사를 필요로합니다. 즉, 사람들은 독감 테스트를 위해 충분한 수의 의사를 방문 할만큼 아플 필요가 있다는 것을 의미합니다. 그런 다음 실험실은 그 추세를보고해야합니다. 치료를 동원 할 수있게 될 때까지 사람들은 이미 아플 것입니다.