NGMsoftware

NGMsoftware
로그인 회원가입
  • 매뉴얼
  • 팁 앤 테크
  • 매뉴얼

    팁과 테크니컬 노하우를 확인하세요.

    팁 앤 테크

    팁과 테크니컬 노하우를 확인하세요.

    본 사이트의 컨텐츠는 저작권법의 보호를 받으므로 무단 복사, 게재, 배포 등을 금합니다.

    스크립트 중급부터 하나씩! - 통계 분산 알아보기. (Know the variance of statistics.)

    페이지 정보

    본문

    안녕하세요. 엔지엠소프트웨어입니다. 오늘은~ 매크로에 대한 이야기보다는 수학에 대해 알아보도록 하겠습니다. 주로 반도체 수율쪽 일을 하다보니 기초 통계를 사용할 일이 많습니다. FDC(Fault Detection Classification)나 SPC(Statistical Process Control)를 하다보면 분산(Variance)이나 표준 편차(Standard Deviation)를 많이 사용합니다. 공정마다 샘플링된 웨이퍼를 계측 장비가 측정하고 값(Value)을 보내줍니다. 보통 TC나 EAP로 보내고 미들웨어를 통해 수집합니다. 그리고 상위 시스템에서 분석하고 알람을 발생시키거나 R2R(APC, Advanced Process Control)에서 계산된 값을 Recipe의 특정 파라메터에 적용시킵니다. 요즘은 보안 때문에 레시피도 메모리로 처리하는데요. 아무튼, 이런쪽 일을 하고 있습니다. 엔지엠에는 여러가지 수학 통계 함수들을 제공합니다. 그중에서 분산에 대해 간단하게 알아보도록 하겠습니다. 에디터를 실행하고, 분산을 하나 추가하세요. 비교를 위해 평균값과 중앙값도 추가 해줍니다.

    ※ 분산, 평균값, 중앙값의 데이터에 -10, 0, 10, 20, 30 을 입력하세요.

    giqNVHg.png

     

     

    실행하고 결과를 확인 해보세요. 평균값과 중앙값이 동일하게 10이 나왔습니다. 분산은 200이 나왔네요.

    [분산] 액션이 시작되었습니다.
    분산값: 200
    [평균값] 액션이 시작되었습니다.
    평균값: 10
    [중앙값] 액션이 시작되었습니다.
    중앙값: 10
    [분산 분석.ngs] 스크립트가 완료되었습니다.

     

    분산은 분포의 모양을 결정하는 값입니다. 그리고 편차들의 제곱의 평균입니다. 계측 장비가 측정한 값을 예시로 들면~ 대부분은 무슨 소린지 잘 이해되지 않을겁니다. 일반적으로 학점이나 근태의 지각 또는 타자의 출루에 따라 누가 더 좋은지를 알아볼 때 사용합니다. 여기까지 말해도 잘 와닿지는 않을거에요. 편차로 여러명의 학생 또는 야구 선수나 직원 출근 시간등의 데이터로 평균에서 얼마나 떨어져 있는지는 확인할 수 있습니다. 하지만 그룹내에서 평균적인 편차를 구할 수 없기 때문에 다른 방법을 사용하기 위해 나온것이 분산입니다. 편차의 합은 0이기 때문에 평균을 구할 수 없습니다^^; 좀 더 명확한 차이를 확인하기 위해 분산, 평균값, 중앙값을 추가하고 8, 9, 10, 11, 12 를 입력하고 실행 해보세요.

    qcvsdBV.png

     

     

    분산은 2가 나오지만 평균값과 중앙값은 동일하게 10이 나옵니다. 분산이 작다는 소리는 숫자들이 모여있다는 의미입니다. 그만큼 편차가 작다는 뜻이죠. (편차는 값에서 평균 또는 중앙값을 뺀값이고, 표준 편차는 분산의 값이 너무 커서 제곱근해서 원래 크기로 만든 값입니다.) 저 값들이 야구 선수의 타율이라고 생각해보면 둘중에 어떤 선수가 더 좋은 선수일까요? 분산이 작은 두번째 선수가 좋습니다. 학교 성적이라면 두번째 학생이 더 좋죠. 이렇게 극단적으로 판단할 수는 없지만~ 분산이 작다는 의미는 안정적이라고 해석할 수 있습니다. 몇년에 걸쳐서 누적된 데이터라면 꾸준하게 10점을 내는 선수가 좋다는거죠~ 반도체에서도 수율이 안정적으로 나올때가 좋습니다. 분산이 크다는건 제품의 품질이 균일하지 못하고 불량이 많다는 뜻입니다. 물론, FAB 초기에 Equipments가 안정화까지 시간이 필요하기 때문에 우상향인지 우하향인지도 중요한 지표가 됩니다. 분산으로는 알 수 없기 때문에 YMS의 데이터를 사용해야 합니다.

     

    업무 자동화의 범위가 넓어질수록 이런 함수들도 유용하게 사용될거라 생각됩니다. 하지만, 아직까지는 단순 업무만 자동화가 활발하게 이루어지고 있고 복잡하고 어려운 업무는 사람의 판단과 노동력에 의지해야 합니다. 인공지능이나 딥러닝과 같은 기술들의 진입 장벽이 낮아지고, 적근성과 사용성이 개선된다면 매크로 또는 RPA 분야도 급성장하지 않을까 생각됩니다. 빅데이터나 분석쪽 업무를 하고 있지만... 그렇게 밝은 미래가 보이질 않아서 답답한 부분들이 있네요^^; 엔지엠에서 제공하지 않는 표준 편차와 편차는 [ 여기 ]를 참고하세요.

    ※ 수학이나 통계학 전공이 아닌 기초통계책으로 공부하면서 소프트웨어에 적용하다보니 틀린 내용이 있을수도 있습니다.

     

    개발자에게 후원하기

    MGtdv7r.png

     

    추천, 구독, 홍보 꼭~ 부탁드립니다.

    여러분의 후원이 빠른 귀농을 가능하게 해줍니다~ 답답한 도시를 벗어나 귀농하고 싶은 개발자~

    감사합니다~

    • 네이버 공유하기
    • 페이스북 공유하기
    • 트위터 공유하기
    • 카카오스토리 공유하기
    추천5 비추천0

    댓글목록

    등록된 댓글이 없습니다.