2010년에 실시된 제4회 연간정기서베이에서 다음과 같은 넘어야할 장애물들이 존재한다고 데이터 마이너들은 언급하였다. 즉,

 

 - 정제되지 않은 데이터 문제

 - 데이터 마이닝을 타인에게 설명해야 하는 어려움

 - 데이터의 부재/접근의 어려움

 

 데이터 마이너들운 제4회 연간정기서베이(2010)에서 문제점을 극복했던 그들의 경험을 공유하였습니다. 아래에 그들이 공유한 최고의 연습용의 예제가 언급되었습니다. 각 데이터 마이닝 문제점들을 극복한 사례들의 완성된 목록은 다음 링크들을 통해서 역시 사용이 가능합니다.

 

도전과제 : 정제되지 않은 데이터

 

제4회 연간정기서베이에 응답한 735명의 데이터 마이너들의 85%는 문제점을 극복한 그들의 경험을 설명했습니다.  핵심 주제는 기술통계량의 사용과 데이터 시각화, 비즈니스 규칙, 그리고 전문적인 데이터 내용에 대한 참고였습니다. (비즈니스 사용자) 많고 다양한 세부적인 제안들이 공유되었다. (모든 85가지 응답들을 여기에서 볼 수 있다.)

 

 이 문제를 해결한 선택된 데이터 마이너들의 설문조사 응답 사례 :

 

 - 모든 프로젝트는 레코드의 수, 핵심 조합(특이 사항, 과부/고아), 그리고 필드 내용의 분포를 보여주는 등 낮은 수준으로 데이터 보고를 시작합니다. 이런 보고서들은 고객의 전문가적인 내용의 데이터로 다시 되풀이됩니다.

 

 - 정제되지 않은 데이터의 한계에서, 우리는 두 가지 방법을 결합하여 사용합니다. : 알려진 데이터를 기반으로 한 직관과 데이터 프로파일입니다. 알려진 데이터를 기반으로 한 직관은 그들의 데이터를 진정으로 알기 위해 우리의 인간의 분석능력을 요구합니다. 만약 그것이 보통치를 넘어서면, 우리는 그 데이터가 정확한 것인지 확인하기 위해 유효성 검증을 거칩니다.

 

 - 결측 데이터(missing data)의 조직전인 패턴을 쉽게 확인하기 위해 플롯에서 결측된 데이터를 보는 것을 잊지 않아야 합니다. (MD) 결측 데이터의 다중 대체는 데이터 셋을 분리하거나 결측값을 계산하지 않는 것보다 낫습니다. 대신에 새로운 카테고리로 결측값을 이분화 하고 적극적으로 모델을 만듭니다. 결측 데이터는 곧 정보입니다. 기능 선택으로 랜덤 포레스트를 사용합니다. 나는 너무 많은 변수들을 조합하여 노이즈가 많고 복잡한 모델들을 만들었습니다. 모델링하기 전에 RF를 하면서, 나는 결국 단지 5~10개의 변수로 뛰어난 모델을 만들었습니다.

 

 - quick K-means 군집화 기법은 단일의 관측 군집화로써 가장 안 좋은 것으로 드러났습니다.

 

 - 이분형 레코드에서 (레코드를 이분하기 위해) 이상치 탐지기를 사용 해아합니다.

그들은 보통 Gribot가 주장하기를 내가 훨씬 데이터를 정제하기 위해 사용할 수 있을 것이라는 것보다 더 포괄적인 규칙을 공식화합니다.

 

 - 우리는 데이터에 대한 기술 통계량을 계산하고 모델링 프로세스를 시작하기 전에 데이터를 그려봅니다. 데이터의 비즈니스 고객과의 토론은 더 나은 이해를 위해 도움이 되어왔습니다. 우리는 데이터 값의 다중 결합을 보는 것으로써 데이터의 복잡성을 이해하기 위해 노력합니다.

 

 - 상기자에 의해 주어진 각 변수들의 훈련용 의사결정나무는 a) NULL값으로 대체하고, b) 편향된 값 (전문가)을 확인하는 것을 가능케 합니다.

 

 - 우리는 퍼지 그룹을 사용하는 가상 군집화와 이상치의 인공적인 다차원 정의를 만들었고 정제되지 않은 데이터를 찾아내려고 노력했습니다.  찾아진 결측 데이터의 점검은 정제되지 않음의 구체적인 유형에 대한 판별하는 프로그램을 짜는데 실마리를 제공했습니다.

 

 - 빠르게 데이터 시각화가 가능하다는 것은 우리가 고객에게 정제되지 않은데이터의 존재를 알리게 한 것입니다. 업리프트 모델링의 서술은 만약 대조 그룹이 고객이 말한대로 랜덤하게 되어있다는 것이 진짜라는 점을 분석자들이 안다는 보고서를 포함합니다. (우리는 종종 편향을 발견합니다.)

 

 - 일반적으로 정제되지 않은 데이터와 같은 다양한 비즈니스 단위로 작업하는 것은 쓸모없는 일은 아닙니다. 문제점을 통해 작업을 함으로써 당신은 단지 정제된 데이터로 작업하는 것보다 더 데이터 셋에 대한 이해가 쉬어질 수 있습니다. 왜냐하면 데이터가 정제되고 확실하다고 해서 모든 변수를 완벽히 이해할 수 있는 것이 아니며 또한 데이터가 처음에 왜 수집되었는지에 대한 원래의 의도도 완벽히 이해한다는 것을 의미하지 않기 때문입니다.

 

도전 과제 : 데이터 마이닝의 설명

 

제4회 연간정기서베이에 응답한 735명의 데이터 마이너들의 65%는 문제점을 극복한 그들의 경험을 설명했습니다. 핵심 주제는 그래픽의 사용, 매우 간단한 예제와 유추, 그리고 초보적인 데이터 마이닝의 비즈니스 효과에 초점을 습니맞추는 것입니다. 많고 다양한 세부적인 제안들이 공유되었습니다. (모든 65가지 응답들을 여기에서 볼 수 있다.)

 

이 문제를 해결한 선택된 데이터 마이너들의 설문조사 응답 사례 :

 

 - “분석자 간 경쟁의 영향력과 다른 기관의 사례 연구는 가능성 있는 검정력을 만듭니다. 국내에서 작은 효과가 있는 프로젝트를 가져오면 기업은 채택하는 것을 통해 프로젝트를 증진시킵니다. 마지막으로, 의미있는 적용으로 데이터를 제공하면 – BI 도구 데이터 마이닝이 구현 가능하다는 것을 우리의 이해관계자에게 보여줍니다.

 

 - DM 베이직과 목적에 대한 초보 지식 공유 세션.

 

- 그래픽 표시는 매우 유용합니다. (, 이익 도표 또는 리프트 차트)

 

 - 문제는 문제를 낳기 위한 충분한 시간을 가지고 해결책을 보여줍니다. 대부분 상위 경영진은 짧은 프레젠테이션을 원하지만 단지 결과를 얻을 수 있는 원인은 없습니다. 그들은 원인에 대해 관심이 없기 때문에 종종 솔루션을 구입하지 않습니다. 따라서 우리는 그들의 열망하는 직접적인 보고서를 작업하기 위해 노력하고 그들이 전체 프레젠테이션을 볼 수 있도록 합니다. 만약 그들이 솔루션을 구입하는 경우, 상위 경영진들은 그들의 직계 상관과 함께 솔루션을 지킬 것입니다.

 

 - 균형잡힌 시트와 P&L에 대한 모델 적용의 전체적인 이익, 달러에 초점을 맞춥니다.

 

 - 대조 그룹과 비교된 측정결과는 데이터 마이닝 결과에 대하여 사람들을 설득시키기에 가장 좋은 방법입니다.

 

 - 나는 제품 관리자(클라이언트)를 가져와서 그들에게 중요한 분석들을 그들과 함께 일했습니다. 그래서 내가 다양한 측면을 분석하기 위해 그들의 전문성에 따라서 데이터를 다루는 방법이 그들에게 흥미를 주었습니다.

 

- 영상 및 그래픽 프레젠테이션을 한 비즈니스에 미치는 영향과 결과를 설명하는 것, 역사적 동향 및 변화 분석을 설명하는 것은 논리적으로 비즈니스 사용자에게 데이터의 비즈니스 동향을 설명하는데 도움을 줍니다.

 

- 진실된 철학 중 하나의 관점. 변수들의 정의는 비즈니스 기능에 따라 모순되지 않습니다.

 

- 시각화 및 설명 모델 및 모델 공간. 결과를 설명하고 해석합니다. 결과의 유의성과 평가를 보여주고 설명합니다.

 


도전과제 : 데이터의 부재/접근의 어려움

 

제4회 연간정기서베이에 응답한 735명의 데이터 마이너들의 46%는 문제점을 극복한 그들의 경험을 설명했습니다. 핵심 주제는 데이터 가용성 향상시키는 것에 대한 자금을 바치는 것과 조직 장벽을 극복하기 위한 방법이었습니다. 많고 다양한 세부적인 제안들이 공유되었습니다. (모든 46가지 응답들을 여기에서 볼 수 있습니다.)

 

 이 문제를 해결한 선택된 데이터 마이너들의 설문조사 응답 사례 :

 

 - 우리는 더 낫고, 더 쉽고, 더 빠른 데이터 접근을 하기 위해 계속 노력합니다. 사실, 통계 분석자들의 스트레스를 줄이기 위해, 우리는 데이터 수집에만 전체 시간을 할애하면서 일하는 데이터 수집 전문가를 고용했습니다.

 

- 나는 보통 데이터의 부재 또는 불변의 변수를 다루는데 합리적인 발견을 계획하기 위해 적합한 콘텐츠 전문가와 상의합니다. 데이터 접근이 어려운 것은 전형적으로 우리가 필요한 데이터를 모으는 좋은 계획을 가지지 못했음을 뜻합니다. 나는 제품 관리자와 상의하고 그들의 비즈니스 문제에 대한 데이터 필요를 제안합니다. 만약 우리가 필요와 비즈니스 이슈를 잘 매치할 수 있다면, 데이터 접근과 이용가능성은 대개 해결됩니다.

 

- 우리의 가장 좋은 사례는 정의된 기간 동안 자동적으로 모집된 데이터 마이닝 목적 분석적인 데이터 셋 - 에 대한 온전한 데이터베이스를 이행하는 것과 고안하는 것입니다.

 

- 직접 고객과 함께 작업하기 위해 사업부 사이트에서 많이 활동하는 것과 로컬 IT.. 일반적으로 가장 좋은 사례를 두고 이후에 우리가 찾을 수 있는 정제된 거의 적은 데이터를 찾아둡니다. 앞으로 우리는 일반적으로 더욱 로버스트한 데이터 수집과 프로젝트를 계획합니다.

 

- 데이터가 이용하기 어려울 때, 우리는 데이터가 존재하던지, 장기적 거부자 이던지 상관없이 우리의 차선책모델을 제공합니다. 이것은 진짜 현재 솔루션에서 향상되지는 않습니다. 그러나 (i) 우리와 연락을 계속 하는 사람 (ii) 우리가 요구했던 데이터를 얻는 더 나은 일은 하는 사람들을 매우 효과적으로 얻을 수 있는 것으로 증명됩니다.

 

 - 데이터의 접근은 비즈니스 팀 수준에서 해결됩니다. 그 이유가 데이터의 결함은 비즈니스 팀의 목표가 우리의 지원과 맞지 않다는 의미가 되기 때문입니다.

 

- 심각한 문제 중 하나는 우리가 필요로 하는 정부기간이 데이터를 생성함에 있어서 신뢰성이 결여되어 있다는 것입니다. 그들은 만약에 범할 수 있는 과실을 두려워하거나 데이터 처리작업에 대한 지식이 부족한 사용자를 이해시키는 것을 꺼리기 때문입니다. 우리가 작업했던 데이터 공유를 위한 접근은 데이터 접근을 제한하는 흥미로운 집단을 형성시키는 데이터와 데이터 사용을 다루는 기관을 위한 것입니다.

원문보기
 http://www.rexeranalytics.com/Overcoming_Challenges.html

Posted by JDATE
잡다한 이야기2011. 7. 19. 12:45


“귀하는 소리나 시각적인 차원이 아닌 또 다른 차원, 데이터 차원을 여행하고 있습니다. 이는 비즈니스적인 식견을 갖추고, 경계에 제한이 없는 놀라운 세상으로의 여행입니다.  귀하의 다음 도착지는 바로 분석의 세계입니다.”


분석지수 AQ(Analytics Quotient)는 조직이 사업의 새로운 방향을 제시하고, 더 나은 결정을 내리고, 더 나은 성과를 만드는 것에 분석을 적용할 조직의 준비, 능력, 수용력의 지수입니다.  간단히 살펴보면, AQ는 모든 규모의 조직들이 얼마나 분석을 잘 이용하는 가를 평가하는 것을 도와줍니다. 그리고 보다 중요한 점은 AQ가 어떻게 조직이 분석이용을 시작하는가, 분석여행을 위한 첫 시작을 어떻게 내딛느냐, 혹은 더 높은 수준의 분석효율성을 갖추기 위해 어떤 과정을 거치느냐를 평가하는 것에 도움을 준다는 사실입니다.

IBM SPSS Data Collection 소프트웨어에 의해 구현된 AQ퀴즈를 풀어봄으로써, 조직은 회사의 분석 성숙도를 나타내는 AQ점수를 실시간으로 측정해 볼 수 있습니다.  분석지수 성숙도 모델은 조직이 네가지의 단계(novice, builder, leader, master) 중 어디에 해당되는지를 알려주고, 다음 단계로 나아가기 위한 계획을 제안해 줍니다.

예를 들어, 귀하의 조직은 식견가득한 예측을 만들고, 가능성높은 결과를 예측하고, 자동적으로 결정하는 능력을 갖추고 과거로부터 얻은 역사와 배경을 적용하고 있습니까? 그렇다면 귀하는 높은 AQ점수를 받을 것입니다.

 

IQ EQ처럼, AQ는 더 나은 의사결정을 위해 그들의 데이터 자산을 활용함에 있어, 조직이 얼마나 똑똑한지 결정하는 새로운 측정방식입니다.

 

오늘날의 조직들은 예전보다 더 커진 불확실성과 위험, 주주들로부터의 더 큰 압력, 새로운 제도, 데이터 양의 폭발, 사회네트워크의 급증 그리고 우리가 이제까지 한번도 볼 수 없었던 모바일장치등에 대처해야 합니다. 이것은 새로운 현실이며, 새로운 정상”입니다.

 

개별기업 리더들은 동료들의 능력을 뛰어넘고, 그들의 팀과 조직의 성공을 위해 상당한 기여를 해야 하는 막대한 부담을 느낍니다. 그러나 개인경험에 의해서 취득된 정보나 직관은 더 이상 충분하지 않습니다.

 

의사결정권자들은 그들의 비즈니스가 어떻게 되어가고 있는지, 왜 본 궤도에 있거나 본 궤도를 벗어나 있는지, 그들이 해야 하는 것은 무엇인지에 대해 더 잘 이해하는 것을 도와줄, 실행 가능한 통찰력을 얻기 위한 넓은 비즈니스 분석능력을 요구하고 있습니다.

 

MIT Sloan Management IBM’s Institute for Business Value 가 시행한 최근 연구는 가장 효과적으로 분석을 사용하는 조직은 이제 막 분석을 사용하기 시작하는 경쟁사보다 그 결과가 거의 세 배나 높은 모습이었다고 합니다.

 

이와 비슷하게, 최근 IBM 에서 시행한 CFO Study영업이익의 두 배 성장, 36%의 연평균 성장률, 15%의 투자수익률과 같은 객관적인 재무정보는 비즈니스 통찰력이 뒷받침된 의사결정이 더 뛰어난 결과를 만드는 것을 입증한다는 것을 보여주었습니다.

 

분석여행

 

사업단위를 넘어선 비즈니스 분석의 통합은 하나의 비즈니스부서, 직무에서 시작됩니다. 하지만 빠르고 실체적인 결과와 함께 도입은 조직 전반에 넓고 깊게 지속됩니다. 조직의 분석여행은 경쟁력을 더 크게 향상시키고, 더 높은 이익으로 돌아옵니다.

 

그러므로 AQ측정은 하나의 조직이 얼마나 전적으로 비즈니스분석을 받아들여왔는가를 보여주도록 만들어졌습니다. 더 많은 분석이 비즈니스에 도입이 될수록, 기업은 타 기업들보다 수익은 말할 것도 없고, 더 뛰어난 성과를 보이고, AQ지수는 더 높이 상승할 것입니다.

 

따라서, AQ는 평가를 위한 더욱 명백한 방법을 만들기 위해 창조되었습니다.

 

모든 조직, , 개인은 각각 그들의 점수대에 있습니다. 어떤이들은 초보자인 반면에 어떤이들은 숙련자의 수준입니다. 발달모델은 AQ를 향상시키는 네 개의 기본적인 단계를 보여줍니다.

 

 

AQ 4단계 모델

 

Novice(초보자) : 조직에 정산표가 있지만, 신뢰할 수 없습니다. 그것은 선행적이기

보다 반응적입니다. 그들은 다른 부서간에 연결되어 있지 않고 더 잘하기만을 원합

니다.

 

Builder(구축자) : 조직은 현재의 결과를 알고, 무엇이 그러한 결과를 초래하였는가에 대해 조금 압니다. 부서에 있는 다른 팀들과 결과를 공유하고 있으며, 더 많은 것을 받아들일 준비가 되어있습니다.

 

 

Leader(선도자) : 부사장이 전략을 세우고, 마케팅팀과 영업팀은 매트릭스와 계획을 공유합니다. 그들은 과거에 대해 재고할 뿐만 아니라 미래를 예측합니다.

 

Master(숙련자)  : 상부의 목표가 조직 하부의 전술과 맞아떨어집니다.  모든 본부와 부서들이 통찰에 대해 자유롭게 통하며, 동등한 속도와 용이함으로 자원은 모두 배분되고, 위험은 최소화되었으며, 결과는 최대화되었습니다.

 

분석적 자유를 누릴 준비가 되었습니까? 그 어느 때 보다, 미래의 성공은 급증하는 데이터의 범람을 더 나은 의사결정으로 전환하는 능력에 달려있습니다. 매년 두 배로 늘어나는 데이터의 양과 함께, 높은 AQ점수를 갖는 것은 경쟁에서 앞서가기 위해 불가피한 것입니다.

 

우리는 분석의 세계로 떠나는 여행에 귀하를 초대합니다. 의심할 여지 없이 귀하는 황혼의 잘못된 방향으로 이끄는 떳떳하지 못한 통찰력을 더 이상 비즈니스에 적용하지 않을 것입니다.    

 

귀하의 분석지수(AQ)를 측정해 보세요!

 

http://www.ibm.com/analytics/aq 를 방문해서 빠르고 쉬운 퀴즈를 풀면,  귀하의 분석지수를 알 수 있습니다.  또한 귀하의 분석지수가  분석을 향한 여행에서 어느 위치에 있는지 알 수 있습니다. 또한 귀하는 생각을 공유하거나 더 높은 성과를 내기 위해 높은 분석지수를 활용하는 다른 이들과 교류할 수 있을 것입니다.

 

Posted by JDATE
행사안내2011. 7. 15. 18:33
SPSS Korea

'행사안내' 카테고리의 다른 글

37차 실습세미나 (8/31) - 'SPSS Modeler 사회네트워크분석'  (0) 2011.08.19
[SPSS Korea] 9월 정기교육 안내  (0) 2011.08.05
Amos Day 2011  (0) 2011.07.06
SPSS 뉴스레터 VOL.6  (0) 2011.07.05
SPSS RoadShow 2011  (0) 2011.06.30
Posted by JDATE
고객사 이야기2011. 7. 14. 21:31



날카로운 눈과 각진 턱의 Memphis의 경찰 간부 Larry Godwin은 어느 모 로 보나 진지하고, 전형적인 옛날 경찰의 모습을 한 남자이다. 그의 힘찬 악수에서 느껴지는 오래도록 남아있는 여운을 생각해본다면, 그가 미 해 병대에서 38년 간 근무했다는 이야기를 들어도 전혀 놀라지 않을 것이다.

위장근무를 시작한 후, Godwin은 2004년 자신의 현재 업무를 맡기 전에 Memphis PD 부 국장을 하면서 순찰, 경찰 특수 기동대, 살인 그리고 특 수 작전을 포함하여 모든 분야의 업무에 착수했었다.

그 이후, Godwin 절묘하면서도 강력한 방법으로 그만의 특징이 있는 정책을 만들고 자신만의 리더십을 프로젝트에 잘 적용 시켜나가는 모습을 보여 주었다. 예를 들어, 경찰 간부로서 Godwin의 첫 번째 시행한 일 중 하나는 현장에서 일을 하는 일반 경찰이 파란색 셔츠를 입고 그리고 지도 자(책임자)는 흰색 유니폼을 입는 기존의 정책을 모든 경찰이 파란색 셔츠 로 입도록 바꾸는 정책이었다.

Memphis PD는 계층적인 사고를 피하는 팀으로 그리고 모든 경찰 구성원들이 범죄에 맞서 싸우는 역할을 하도록 운영되어야 한다는 것이 Godwin의 가장 핵심적인 메시지였다. 이러한 접근법은 부분적으로 “당신이 어디 출신인지 잊지 말아요.” 라는 계급을 통해 자주 만들어지는 사고방식을 반영한다. 그러나 Godwin의 경우엔, 좀 더 효과적으로 범죄와 대응할 수 있는 새로운 접근을 시도할 수 있게 해준 ‘진보적인 직감’이 표현된 것이다.

당신의 직감을 따르라

이러한 직감을 이용하여 Godwin은 ‘어떻게 하면 증가하고 있는 범죄의 발생을 멈출 수 있는가‘에 대한 고무적이고 신선한 아이디어를 얻기 위해 Memphis’의 법률 집행 A 팀의 Landmark 회의를 소집했다. ‘cafeteria summit’ 이라 불리는 회담 자리에서, Godwin과 부서의 조직범죄 부대(OCU)의 핵심멤버들은 Memphis의 구역까지 포함하여 관리하는 구 검찰 총장인 Bill Gibbons 와 Memphis 대학의 범죄학 교수인 Richard Janikowski와 함께 자리에 앉았다. 적당한 가격의 음식이 쟁반에 담겨 옮겨오는 동안, Godwin은 증가하는 범죄, 동결되었거나 혹은 심지어 감소하고 있는 예산과 그리고 멤피스 주민들의 커져가는 환멸감에 대한 시나리오의 대략적인 개요를 만들고는 모든 아이디어를 받아드릴 준비를 했다. Janikowski는 대학의 범죄학 커뮤니티 센터의 이사로서 연구와 아이디어는 그의 전문 분야이며, 지난 10년 간, 그는 범죄 유형을 더 잘 이해하기 위해 분석적인 활동에 참여해왔다.

현재, Janikowski 는 조언을 받길 원하는 MPD와 함께 간단하면서도 강력한 관행을 실행할 기회를 기다리고 있다. "만약에 지능적으로 경찰 자원을 적절한 장소와 적절한 날에 적절한 시간에 투입하는 것에 집중한다면 좋은 일이 일어날 것입니다."라고 한 후 “당신은 범죄 행위를 억제하거나 또는 범인을 잡을 수 있을 것입니다.” 라고 Janikowski는 덧붙였다.

 대담한 실험이 큰 결과를 만들어 내다

 Godwin은 Janikowski 에게 들은 내용이 만족스러웠다.

경찰 부서들의 정보를 절대로 공유하지 않으려하는 뿌리 깊게 배어 있는 성향에 반대하는 하나의 표현으로 Janikowski 는 동료들과 함께 주요 범죄 데이터를 주기적으로 공유하기로 했다. Janikowski의 임무는 이러한 범죄 데이터를 이용해서 시험용 프로그램의 기초로 사용될 분석적 체계를 개발하는 것이다. 그리고 그 결과를 통해서 시험용 프로그램이 분석적이고 운영적인 접근방식에 있어서 효과가 있는지 없는지 밝히게 될 것이다. 몇 개월 후, 3일간의 작업으로 구체화된 활동은 예전에는 존재 하지 않았던 가장 효과적인 방법임이 증명되었다. 세분화된 수준에서 ‘주요 지역’ 을 확인함으로써 MPD는 단지 처음 두 시간 안에 약 70명의 범죄자를 체포했다. 이는 보통 일주일 동안에 만들어지던 숫자이다. 그리고 약물부터 무기와 매출 그리고 "생활의 질"에 관련된 생활 범죄까지 포함해서 총 1200명을 잡기에 이르렀다. 그러나 이것은 좋은 출발이지만 단지 시작에 불과하다. Godwin은 오랜 시간을 통해서 프로그램의 성공은 단지 예측적 분석 기능뿐만 아니라 부서에서 운영프로세스에 적응해서 최대한 활용을 하는 것이 중요하다는 것을 알게 되었다. 또한 Godwin은 시험용 프로그램이 실제로 시스템적인 변화에 이르기 까지는 특히 길거리 밖에서 순찰을 도는 경찰들부터 더 많은 금액적 지원이 필요하다는 것에 대해서도 더 깨달았다. 그것은 단지 예측적인 모델링이 어떻게 경찰관들을 더 효율적으로 도울 수 있도록 의사소통을 할 것인가에 대한 질문일 뿐만 아니라, 또한 경찰관들로부터 어떻게 지식을 듣고, 들은 지식을 어떻게 활용할 것인가에 인지하는 것이 포함된다. “아무도 일주일에 6일 또는 7일 동안 하루에 8시간에서 10시간순찰차를 타고 있는 경찰관보다 잘 알 수 없습니다.” 라고 Godwin은 말한다. 경찰들의 마음을 열 수 있는 가장 좋은 방법은 우리가 경찰관이 가지고 있는 지식과 경험으로 부터 배우고자 하는 의지 의지를 보여주는 것이다. 시장에게 프로그램이 확실하게 승인을 받을 수 있도록 하기 위해서 Godwin은 멤피스가 대부분의 주요 미국 도시들처럼 똑같이 겪고 있는 -동결하거나 혹은 축소하는 자원 문제가 증가하는- 잔인한 예산 현실에 반향을 불러일으키는 사업계획서를 준비했다. 사업계획서는 MPD가 범죄 행위의 증가를 막기 위해 또 다른 500 순찰대를 추가할 필요하다는 내용으로 많은 사람들에게 인정받았지만 이 사업계획서를 실제로 실현하기 위해서는 거의 6년이 걸린다. Godwin의 목표는 Memphis 주민들의 관심 아래서 어떻게 경찰 자원을 지능적으로 배열하는 것이 효과적으로 부서가 현재의 인적자원의 차이를 줄일 수 있는지 보여주는 것이다.

Godwin 제안한 프로젝트가 진행되면서, MPD의 각각의 관할 경찰서의 총경는 (초과 근무 기금의 형태로) 금액적인 지원을 받았다. 그리고 솔루션에서 제공하는 정보를 기반으로 그들 스스로 경찰 배치에 대해서 유연하게 결정할 수 있게 되었다. 가장 중요한 것은, 결과들이 엄격하게 측정되어지고, 총경들은 그들의 실적과 성과에 대해서 책임을 져야한다는 것이다. 그 프로그램은 많이 판매가 되지 않았기 때문에, 몇 시간 후 Godwin과 시장은 새로 승인된 프로그램-지능적으로 범죄율을 줄일 수 있는 방법으로서 알려진 Blue CRUSH-를 언론 앞에서 홍보했다.

 

치안 유지는 열심히 하기 보단 영리하게

근육을 사용하지 않고도(몸을 쓰지 않고도), Blue CRUSH는 실제로 통계 기록을 활용해서 얻을 수 있는 통찰력과 민첩성으로 범죄를 감소시킬 수 있는 장점이 있다. 그것은 MPD의 기록관리 시스템을 비롯해서 길거리에서의 비디오카메라에 촬영된 사건들과 같이 새로운 범죄 데이터를 포함하고 있는 예측적인 모델이다. 범죄퇴치분석의 영역에 있어서, "흥미로움"과 실행 할 수 있는 일 사이에는 미세한 차이가 있는데, 이전 보다 후자에 있어서의 강점 때문에 Blue CRUSH가 두드러지게 되었다. Blue CRUSH는 범죄 동향에 영향을 미칠 수 있는 장기간의 요인 (버려진 주택 등) 에 대한 깊은 이해 뿐 아니라, 효율적으로 신속한 응답을 촉진시키는 하나의 방법을 이용해서 근본적인 범죄 트렌드를 밝혀낸다. 주로 Blue CRUSH는 관할 경찰서의 수준에서 사용된다. 범죄의 "주요 지역"를 보여주는 다층의 지도를 보면서 총경들은 현재의 활동 수준뿐 아니라 경찰의 배치와 전략에서 이전의 변화를 통한 결과와 같은 변경된 활동들에 대해서도 알 수 있다. 각 주간 회의에서, 총장들은 어떤 것이 효과가 있었는지, 어떤 것이 효과가 없었는지, 그리고 어떻게 다가오는 주에 전략을 변경할 수 있는지 판단하기 위해서 경찰들과 함께 이러한 결과들을 검토했다. 예를 들면, 어떻게 강도들이 그들을 돕는 사람들을 두는지, 또는 어디서 도둑들이 자신들을 도와주는 사람들을 두고 차를 훔치고 있는지 그리고 훔친 물건을 어떻게 다른 사람에게 판매하는지를 아마 알 수 있을 것이다. Godwin은 가장 눈에 띄는 것이 단위라고 말한다. 그리고 "우리는 즉시 이것을 캐치하고 매일하고 있습니다."라고 하며 “짧은 공지로, 우리는 특정한 구로 특정한 날에 즉시 교대 상태로 경찰들을 옮겨 보낼 수 있습니다. 이것은 약간 체스 경기와 같습니다. 그리고 우리가 예전에는 전혀 체포를 하지 못했던 부분에서도 체포를 할 수 있도록 도와줍니다.” 라고 말했다.

 

책임, 성공으로 가는 열쇠

 만약 MPD의 성공 스토리에 숨겨진 영웅이 있다면 바로 ‘책임’이다. 초창기에 MPD가 노력한 것과 같이 분석적인 경찰의 업무에 있어서 다른 부서의 경험은 Godwin에게 철저하고 일관적인 보고 관행과 일반적인 통계 수치를 채택하는 것, 그리고 경찰서의 관활 구역을 관리하는 것의 중요성을 알려주었다. Godwin은 이러한 메시지를 두 가지의 방법으로 부서에 전달하였다.

그의 첫 번째 결정은 신중한 선택의 결과와 불확실한 의미를 비교하는 것을 방해 받고 있는 모든 총경들을 위해 표준화된 보고 양식을 쓰도록 하는 것이었다. 또한 Godwin의 두 번째 결정은 메시지를 보강하여 모든 메시지의 불확실성을 없애기 위해서 주간 세션 회의의 이름을 TRAC (Tracking for Responsibility, Accountability and Credibility) 회의로 바꾼 것이다. TRAC 회의는 Godwin이 관할 구역의 총경들을 위해 그들의 아이디어와 많은 경험, 서로의 실수로부터 배울 수 있도록 문화를 더욱 더 공유하고 개방할 수 있도록 만든 토론회이다. Memphis의 지능적인 치안 전략의 결과물들을 많은 사람들에게 알려야 한다. 도시 전역의 Blue CRUSH가 출시된 이후로 Blue CRUSH는 예리하면서도 지속적인 Memphis의 심각한 범죄 30%와 강력 범죄 15%의 범죄율을 감소시키는 효과를 가져왔다. 최근 특정한 Memphis 의 마약 중개인들을 대상으로 한 첫 시행은, 범죄자 50명을 체포하고 타겟 지역의 범죄를 36.8%를 감소시켰다. 이는 Blue CRUSH의 첫 시행 규모를 짐작하게 한다. MPD의 중범죄퇴치조직을 뜻하는 FAU는, 경찰들이 필요해서 집중하고자 하는 사건의 유형을 최적화하기 위해 Blue CRUSH를 통한 통찰력을 활용한다. 차후의 경찰 자료의 재편성의 결과에서 보면 FAU의 유죄 판결 비율은 16%에서 거의 70%까지 4배가 증가 했다.

숫자를 넘어서

Janikowski 교수는 자신의 부서와 함께 지속적으로 협력하여 MPD의 결과에 공헌한 것에 대해 자랑스러워하는 반면에, 또한 그 숫자들은 단지 부서의 성공 이야기의 단적인 면이며, Blue CRUSH의 진정한 효과는 Memphis 시민들의 향상된 삶의 질과 안정과 같은 인간적인 수준에서 볼 수 있다고 덧붙였다. “지능적인 치안을 통해서 달성하는 것이 가능했던 MPD의 범죄의 30% 감소는 단지 숫자로 보여 지는 것이 다가 아닙니다.”라고 Janikowski는 말한다. 총으로 위협을 받는 것과 같이 범죄를 경험 해본 적이 없는 사람과 또는 집에서 강도를 당해본 경험이 있는 수 백 명의 사람들이 있다. 이러한 범죄 경험의 유무는 사람들의 삶에 있어서 커다란 차이를 가져올 수 있다.

출처 : IBM 웹사이트

원문보기 : http://www.ibm.com/smarterplanet/us/en/leadership/memphispd/assets/pdf/IBM_MemphisPD.pdf

동영상 보기 :  http://youtu.be/_xsffIAHY3I

Posted by JDATE
고객사 이야기2011. 7. 12. 17:50


그랜드 슬램의 또다른 시작

경기의 진행을 평가하고 게임에 영향을 줄 수 있는 승부수를 분석하기 위하여, 실시간으로 분석 소프트웨어를 사용합니다. 올해 처음으로 IBMSPSS 분석 소프트웨어를 사용하여 경기를 진행하고 승부수를 결정짓는 요소를 파악하기 위해, 5년간 39,000,000개의 그랜드 슬램 토너먼트 데이터를 분석해 왔습니다.

테니스 게임에서, 경기 데이터에 대해 더 깊은 통찰력을 가지게 된다면, 자신의 상대를 이해하는데 도움이 됩니다. 그리고 이것은 비즈니스에서도 마찬가지입니다. – 통찰력 있는 데이터 분석을 할 수 있다면, 알 수 없다고 생각하며 포기했던 것들을, 당신이 이미 가지고 있는 데이터에서 알아낼 수도 있습니다. 예측 분석은 당신이 속해 있는 조직의 변화를 예상하는데 도움을 줄 수 있으므로, 당신은 더욱 발전된 계획과 전략을 세울 수 있게 됩니다.

당신이 이미 가지고 있는 데이터에 예측 분석 솔루션을 적용하여, 귀사는 예상하지 못한 패턴과 연관 관계를 발견하고 상호 작용을 설명할 수 있는 모델을 개발할 수 있습니다. 이것은 당신에게서 가치가 높은 고객이 떠나는 것을 방지하고, 현재 당신의 고객에게 추가적인 서비스를 판매하며, 좋은 상품을 더욱 효과적으로 개발할 수 있게 합니다. 또한 사기와 위험을 명확히 파악하고 최소화할 수 있습니다. 예측 분석은 당신에게 예측력과 행동력을 제공합니다.



아이폰

이제 세계 최초의 그랜드 슬램 테니스를 아이폰 어플리케이션을 활용하여 즐길 수 있습니다. 당신이 원하는 때에 즉시 스코어를 볼 수 있고, 생방송으로 해설을 들을 수 있으며, 라디오로 윔블던 중계와 일일 하이라이트를 즐길 수 있습니다.

 

앱스토어에서 윔블던 2011’을 검색하세요 무료이며 선수권 대회 이전에 다운로드 받으실 수 있습니다.


 


포인트스트림

IBM 포인트스트림은 테니스 점수와 같은 경기 데이터를 실시간으로 시각화하여 제공합니다. 이것은 다음과 같이 실시간으로 통계를 내어 점수에 대한 심층적인 프리젠테이션을 제공할 수 있습니다.

- 통계, 랠리 카운트 및 포인트 원 제공

- 시합이 진행됨에 따라 승부수를 발견하고 선수의 모멘텀을 실시간으로 추적

SPSS는 추가 분석에 사용되어 왔고, 윔블던에서 처음으로 PointStream을 공급하는 데 사용되고 있습니다. 예측 분석 기술을 사용하여, 우리는 5년 간의 그랜드 슬램 테니스 데이터(~ 39,000,000 데이터 포인트)를 분석하여 그들이 승리할 때의 패턴과 선수의 스타일을 찾아왔습니다. 이 지식은 상대방의 패턴과 스타일에 대항하기 위한 각 선수의 승부수를 결정하기 위해 활용됩니다. 각 경기 전에, IBM의 매치 시스템은 두 경쟁자들의 과거 자료를 살펴 보고 경기 스타일을 비교하여 승부수에 관한 통계 분석을 실시합니다. 이 시스템은 순위를 매기고 정렬하여 상위 3개의 결과를 출력합니다. “대시보드는 매치가 진행됨에 따라 최근 게임의 통계치로 실시간 업데이트 됩니다



공식 윔블던 사이트

All England Lawn Tennis Club IBM은 윔블던 웹사이트를 함께 개발하고 운영했습니다. 올해 새 단장한 이 웹사이트는 현대적인 스타일과 개방형의 풍부한 미디어를 제공하여 팬들에게 생생한 중계와 다시 보기를 제공하며, 블로그 기능과 점수가 변화함에 따라 경기의 일순간을 재현합니다. 작년에 이 사이트는 12,300,000명 이상의 고유 사용자를 확보했습니다.

우리는 또한 wimbledon.org를 모바일 브라우저에서 사용할 수 있도록 최적화했습니다. m.wimbledon.com 사이트에서 제공하는 것은 :

 - 실시간 스코어, 일정, 선수별 득점상황

 - 모바일 장치를 위한 영문 정보지원

 

윔블던 공식 웹사이트를 방문하세요. http://www.wimbledon.com/


출처 : IBM 웹사이트

<원문보기>
http://www-05.ibm.com/innovation/uk/wimbledon/index_b.html

Posted by JDATE
행사안내2011. 7. 6. 09:01

드디어 오늘 Amos Day 2011 이 개최 됩니다.

13시 부터 진행 되는 Amos Introduction 세미나 에서는
"Amos와 구조방정식 모형의 이해" 라는 주제로 세종대학교 우종필 교수가 진행 합니다.


 

Time 13 : 00 ~ 13 : 50

세미나명

 목차

Amos Introduction – Amos와 구조방정식 모형의 이해

구조방정식모델이란?

구조방정식모델 장점

경로분석

확인적 요인분석

구조방정식모델

기타


15:15분 부터는 각 주제별 3가지 세미나가 진행 됩니다. 

1. "다중집단 분석과 다중지표 모형"
이라는 주제로 노형진 교수 세션,
 

Time 15 : 15 ~ 18 : 00

세미나명

 목차

주제별 세미나다중집단 분석과 다중지표모형

  • 인과관계의 인쇄

    쌍방향 인과관계와 다모집단의 분석

    다모집단의 동시분석

    다중지표모형, MIMIC 모형

    수정지표와 Wald 검정에 의한 모델의 개량


 2. "보건,의료 분야에서의 구조방정식 모형 분석 사례" 라는 주제로 강대용 교수 세션,
 

Time 15 : 15 ~ 18 : 00

세미나명

 목차

주제별 세미나보건, 의료 분야에서의

 구조방정식 모형 분석 사례

다중 회귀분석, 모형 구축의 전략
국민건강영양조사 자료를 이용하여 지역에 대한 multilevel data analysis 단계적으로 분석
구조방정식모형을 이용한 사무직 남성근로자의 직무스트레스와
사회심리적 요인이 피로수준에 미치는 영향 분석
대학생의 자아효능감이 우울과 만족도, 죽음태도에 미치는 영향
의료서비스 질이 환자 만족도 서비스 가치, 재이용 의사에
미치는 영향에 대한 구조분석

 3. "구조방정식모형 FAQ" 라는 주제로 김계수 교수 세션으로 구성 되어있습니다.
 

Time 15 : 15 ~ 18 : 00

세미나명

 목차

주제별 세미나구조방정식모형 FAQ

경로분석
구조방정식모형
SEMFAQ



Posted by JDATE
잡다한 이야기2011. 7. 5. 13:09



시계방향으로 도는것처럼 보인다면 우뇌가 좌뇌보다 발달되어 있고, 반시계방향으로 도는것처럼 보인다면 좌뇌가 우뇌보다 발달되어 있다고 합니다.

우뇌와 좌뇌의 기능상의 차이는 아래와 같습니다.

좌뇌
특징 - 말을 하거나 계산하는 식의 논리적인 기능을 관장
언어 - 언어적 기능 : 이름 기억을 잘함, 대화 시 단어를 더 많이 사용, 언어적인 자료의 기억, 언어적 정보의 학습에 익숙
문제해결 - 분석적(논리적) : 체계적인 방법으로 문제해결, 논리적인 생각, 사고
학습 - 직역적 : 논리적 추리를 통한 학습, 수학학습에 익숙
감정 - 이성적, 인지적 : 감정억제, 지적, 기존의 것을 개선 선호, 사실적-현실적인 것을 선호
운동 - 신체의 우측, 기억을 통한 운동의 언어적 표현

우뇌
특징 - 음악을 듣거나 그림을 보거나 어떤 이미지를 떠올리는 기능
언어 - 비언어적 기능: 얼굴 기억을 잘함, 대화 시 신체언어 사용, 음조적인 자료의 기억, 경험적-활동적인 학습에 익숙
문제해결 - 직관적(은유적) : 지각적 판단에 의해 문제해결, 유머스런 생각, 행동
학습 - 공간적 : 기하학적 학습, 공간적-시간적 과정을 통한 학습에 익숙
감정 - 감정적, 예술적 : 감정발산, 창조적, 새로운 사실 발견의 선호
운동 - 신체의 좌측, 공간적 운동, 운동기억, 창의적 운동

Posted by JDATE
행사안내2011. 7. 5. 11:39

'행사안내' 카테고리의 다른 글

SPSS Korea 페이스북과 친구가 되어주세요!  (0) 2011.07.15
Amos Day 2011  (0) 2011.07.06
SPSS RoadShow 2011  (0) 2011.06.30
고객중심경영을 위한 CRM Fair 2011 - 동영상 후기  (0) 2011.06.28
제2회 SPSS 논문공모전  (0) 2011.06.24
Posted by JDATE
행사안내2011. 6. 30. 17:10

'행사안내' 카테고리의 다른 글

Amos Day 2011  (0) 2011.07.06
SPSS 뉴스레터 VOL.6  (0) 2011.07.05
고객중심경영을 위한 CRM Fair 2011 - 동영상 후기  (0) 2011.06.28
제2회 SPSS 논문공모전  (0) 2011.06.24
Amos Day 2011  (0) 2011.06.23
Posted by JDATE
통계분석 이야기2011. 6. 28. 17:55

지난 43년 간 세계 각국의 다양한 분야에서 널리 사용 되어 온 IBM SPSS Statistics의 새 버전이 출시 되었습니다. 이제, 더 빠르고 강력해진 IBM SPSS Statistics 19가 당신의 의사 결정에 힘을 실어 드립니다. 초보자부터 고급 유저까지 모든 레벨의 사용자가 손쉽게 정교한 분석이 가능한 새로워진 IBM SPSS Statistics 19를 만나 보세요!

 

What’s new in IBM SPSS Statistics 19?

 

자동 선형 모형 생성 기능 (Automatic Linear Model) 추가!

새롭게 추가 된 자동 선형 모형 (Automatic Linear Model) 생성 기능을 통해 통계적인 지식이 다소 부족하더라도 쉽고 빠르게 효과적인 선형 모형 분석을 수행할 수 있습니다.

-데이터 자동 준비 기능 (Automated Data Preparation-ADP)을 통해

분석 전 정제 작업의 자동화 구현

-모형의 정확성과 안정성 향상

-범주형 변수 지원

-Best subset과 같은 다양한 단계적 (stepwise) 회귀 분석 기법들이 추가 됨

-분석 결과물에 대한 다양한 시각화가 가능

-IBM SPSS Statistics 네트워크 서버 버전 사용 시 대용량 데이터의 신속한 처리 가능

 

GLMM 알고리즘 탑재

일반화 선형 혼합 모형 (Generalized Linear Mixed Models-GLMMs) IBM SPSS Statistics 19 Advanced Statistics 모듈에서 새롭게 지원 되는 기능으로, 반복 측정 데이터나 비() 선형적 관계가 존재하는 계층적 (hierarchical), 내포적(nested) 데이터를 분석함에 있어 적합합니다. 의학, 사회과학, 학술 연구 및 비즈니스 등 다양한 분야에서 정교하고 복잡한 데이터 상에서도, IBM SPSS Statistics 19의 뛰어난 시각적 인터페이스를 통해 쉽고 빠르게 모형을 구현할 수 있습니다.

 

다이렉트 마케팅 모듈의 향상!

IBM SPSS Statistics 18 에서 처음으로 선보인 다이렉트 마케팅 모듈이, 마케터의 눈높이에 맞춰 기능이 향상 되었습니다. 통계적 분석 결과의 의미가 좀 더 쉽게 해석될 수 있도록 분석 결과(, 그래프)의 설명도가 향상 되었고, 측정 수준을 지정할 수 있는 방법이 다양해졌습니다. 또한 IBM SPSS Statistics 19를 통해 Salesforce.com에 접속하는 것이 가능하며, MS Office Excel 2010 파일을 읽거나 내보낼 수 있게 되었습니다.

 

 

대용량 데이터 처리도 더 빠르게- 최대 200%까지 속도 향상!!

IBM SPSS Statistics Base 모듈에서 대용량의 테이블 생성 시 최대 200%까지 처리 속도가 향상 되었으며, 메모리를 적게 소모하면서 개별적인 수정 작업 또한 가능해졌습니다.


* 구입문의: sales@spss.co.kr

Posted by JDATE