HP는 세 번째 연례 빅 데이터 컨퍼런스 이달 초 보스턴. 크고 작은 다양한 조직이 참여하여 Facebook, Michael Stonebraker, Nate Silver 등의 기조 연설을 통해 빅 데이터의 미래에 대한 통찰력을 얻었습니다. 또한 다양한 프로젝트와 전쟁 이야기를 강조하는 고객들이 주도한 40개 이상의 분과 세션이 있었습니다. HP는 이벤트에서 확실히 소식을 전했지만 Vertica 업데이트 및 새로운 스타트업 이니셔티브, 컨퍼런스는 무엇보다 빅 데이터 이니셔티브의 실행에 관한 것이었습니다. 다음은 참호에 있는 사람들로부터 빅 데이터의 미래에 대해 밝힌 컨퍼런스의 몇 가지 주요 내용입니다.
HP는 세 번째 연례 빅 데이터 컨퍼런스 이달 초 보스턴. 크고 작은 다양한 조직이 참여하여 Facebook, Michael Stonebraker, Nate Silver 등의 기조 연설을 통해 빅 데이터의 미래에 대한 통찰력을 얻었습니다. 또한 다양한 프로젝트와 전쟁 이야기를 강조하는 고객들이 주도한 40개 이상의 분과 세션이 있었습니다. HP는 이벤트에서 확실히 소식을 전했지만 Vertica 업데이트 및 새로운 스타트업 이니셔티브, 컨퍼런스는 무엇보다 빅 데이터 이니셔티브의 실행에 관한 것이었습니다. 다음은 참호에 있는 사람들로부터 빅 데이터의 미래에 대해 밝힌 컨퍼런스의 몇 가지 주요 내용입니다.
데이터 레이크는 헛소리 마케팅입니다
2014년 튜링상을 수상한 마이클 스톤브레이커(Michael Stonebraker)가 지적한 내용입니다. 그의 발언은 업계에서 밀려나는 마케팅 메시지에 분명히 지친 군중들로부터 환호를 불러일으켰습니다. 그는 데이터 쓰나미 또는 기타 기상학적 빅데이터 현상에 대해 언급하지 않았지만 이러한 현상도 BS 범주에 속한다고 가정하는 것이 안전합니다. 결론은 업계가 일부 사람들이 빅 데이터 분석의 개념에 깔끔한 인사를 하기 위해 고군분투하고 있다는 것입니다. 필요에 따라 어느 정도까지는 대부분의 조직이 데이터를 실행 가능하게 만드는 데 있어 뒤쳐져 있습니다. 또한 데이터 수집 계획을 매핑하는 데 어려움을 겪고 있으므로 데이터 레이크의 시각화가 의미가 있습니다. 그러나 단지 데이터를 레이크로 가져오는 것은 조직이 직면한 문제의 아주 작은 부분입니다. 다음 지점으로 이어집니다.
하둡은 빅데이터가 아니다
많은 조직이 Hadoop 인스턴스로 빅 데이터 여정을 시작합니다. 시작은 훌륭하지만 Hadoop을 사용한다고 해서 "빅 데이터"를 수행한다는 의미는 아닙니다. Facebook의 분석 담당 이사인 Ken Rudin은 빅 데이터 미신에 대한 이야기에서 이를 분석하여 인사이트가 아닌 추진 효과의 차이를 강조했습니다.
추진력이라는 개념이 기본적인 것처럼 보이지만 많은 조직이 기술에 몰두하거나 변화를 주도하지 않거나 더 나은 결과로 이어지지 않는 데이터를 살펴봅니다. 영향력을 발휘하려면 균형이 필요하며 이벤트에서 다른 사람들에게 XNUMX번 이상 물었던 질문으로 이어집니다.
어떻게 올바른 질문을 합니까?
조직은 최고의 기술, 가장 뛰어난 데이터 과학자 및 훌륭한 데이터 세트를 보유할 수 있지만 이것이 성공을 보장하지는 않습니다. 올바른 질문을 하는 것은 비즈니스에 영향을 미치기 위한 기본입니다. 이를 달성하기 위해 내가 이야기한 대부분의 회사는 데이터 과학자를 비즈니스 단위에 포함시키고 있습니다. 이것은 그들에게 비즈니스가 직면한 문제에 대한 더 많은 경험을 제공하고 비즈니스 리더가 데이터 중심 질문에 직접 액세스할 수 있도록 합니다. 조직도는 질문하는 사람에 따라 약간 다르게 보이지만 내장된 데이터 과학자가 올바른 구조라는 합의가 있습니다. 이 구조는 더 나은 질문을 할 수 있도록 도와주므로 의미 있거나 실행 가능한 데이터를 더 빨리 얻을 수 있는 부수적 이점이 있습니다.
앞으로의 많은 도전
이 분야의 리더들이 한데 모인 만큼 아직 해야 할 일이 많습니다. 대부분의 빅 데이터 퍼즐은 아직 정렬되지 않았습니다. 물론 모퉁이 조각은 테두리의 대부분에 있지만 대부분의 조각은 여전히 거꾸로 쌓여 있습니다. 고통의 대부분은 속도와 관련이 있습니다. 때로는 레거시 시스템이나 데이터 이식성을 염두에 두고 구축되지 않은 시스템에서 데이터 세트를 이동하는 것이 큰 문제입니다. 적시에 데이터를 분석 플랫폼으로 가져오려면 대부분의 비즈니스에서 많은 작업이 필요합니다. 전송 속도가 엄청나고 데이터가 분석 플랫폼에 더 빨리 들어갈수록 더 빨리 쿼리하고 비즈니스 계획을 조정할 수 있습니다. 판매 데이터는 이 시점에서 가장 일반적인 스레드였으며, 내가 이야기한 일부는 거의 실시간으로 액세스할 수 있었고 많은 사람들이 하루도 채 안 되어 데이터를 확인했습니다. 하지만 많은 사람들이 판매 드릴다운을 받기 위해 며칠을 기다려야 하는 고통에 대해 이야기했으며, 이는 경우에 따라 조치를 취하기에는 너무 늦었다는 것을 의미합니다.
HP는 조직이 역사적으로 컨설팅 영역이었던 이러한 문제를 해결하는 데 도움이 되는 포괄적인 하드웨어, 소프트웨어 및 서비스 제품군을 보유하고 있습니다. HP는 기업이 많은 경우 자체 데이터와 외부 소스에서 사전에 영향을 찾을 수 있도록 지원함으로써 조직이 점진적인 이익을 얻을 수 있도록 지원하고 있습니다. 그것은 빅 데이터의 가능성에 대한 큰 오해 중 하나일 수 있습니다. 물론, 발견할 수 있는 큰 성과가 있습니다. 어쩌면 데이터에서 무언가 변혁적인 것이 나올 수도 있습니다. 그러나 적절한 분석은 야구 선수가 평균적으로 치는 것과 비슷합니다. 규칙적인 싱글 문자열은 훌륭하고 시간이 지남에 따라 훌륭하게 합산됩니다.