2011년 1월 12일 수요일

어떻게 구글의 텍스트 데이터를 100기가바이트를 떠올나요?

에 많이 본 뉴스 흥미로운 http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
익명의 독자가 trigrams과 bigrams, 설정할 수 있습니다. 그래프는 단어 협회와 어느과 우리가 웹 페이지에 그들을 사용하는 빈도를 강조 Google의 웹 데이터로부터 추출되어 문장의 일부를 시각화 차트의 놀라운 시리즈가있다 "씁니다. 크리스 해리슨 카네기 멜론 대학은 발견에서, 예를 들어, 단어는 '그'는 자주에 묶여있다 '주장,'그 동안 '그녀'는 '사랑한다.'와 자주 발견됩니다 하이라이트 단어는 선과 악을, 평화, 전쟁과 같은 그들의 어느쪽와 함께 사용되는 단어 관계의 차트도 있습니다 그리고 PC 및 Mac. " 이런 것들이 많이있다, 그들은 정말 흥미로운있어 찾아보기를 통해.

소설이 읽기 더 Slashdot에에.




댓글 없음:

댓글 쓰기