'광고/용어'에 해당되는 글 5건

  1. 2018.02.28 The multi-Armed Bandit Problem이란? #2
  2. 2018.02.28 The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란?
  3. 2018.02.28 더치 옥션 (Dutch auction)
  4. 2018.02.28 비커리 경매(Vickery Auction)
  5. 2018.02.28 CTR (Click-through rate)

The multi-Armed Bandit Problem이란? #2

광고/용어 2018. 2. 28. 11:41

Multi-armed 이해하기 위해 one-armed 알아봅시다가장 흔하게 예로 들어지는 one-armed 슬롯머신입니다카지노에서   있는 슬롯머신에는우측에 당길  있는  레버가 하나 달려 있습니다.  (기계식 슬롯머신은 영화나 박물관에서   있고 요즈음은 전자식으로 버튼을 누르는 슬롯머신을 쓰고있기는 합니다.)  레버를 잡아 당겼다 놓으면 게임이 시작됩니다

 실제로 카지노에서 빠른 시간 안에 많은 돈을 슬롯머신에서 잃을  있습니다만약에  슬롯머신에서 돈을   있는 기회가 50:50라고 한다면 실제로 돈을 잃을 기회도 50: 50 것입니다하지만 카지노에서 슬롯머신에 bug 넣고 사람들은 실제로 50%보다  빠른 속도로 돈을 잃게 되며  기계가 돈을 강탈해 가기 때문에   레버를 bandit(도둑강도)라고 부르는 이유가 됩니다.
 그러면 multi-armed bandit 무엇일까요Multi – armed bandit problem이라는 것은 예를 들면  사람이 5대의 슬롯머신 세트를 play해야 하는 상황을  있습니다 5대의 슬롯머신에서 최소한으로 돈을 잃고 최대한으로 돈을따야 합니다. 5대의 슬롯머신을 100, 1000 반복되는 게임을 하다 보면 어떤 기계에서 돈을  따게 되고 어떤 기계에서 돈을  잃을  경험적으로   있습니다하지만 가지고 있는 돈은 한정이 되어 있으니 한없이 게임을 반복할   없습니다.
 
 5대의 슬롯머신을 M1, M2, M3, M4, M5라고 하고   각의 기계는 default 값이 달라 돈을 잃고 따는 확률이 다르다고 가정해 봅시다하지만 게임을 하는 사람은 사전에 어떤 기계에서 돈을  많이   있는지는   없습니다따라서 게임을 하는 사람은 빠른 시간 안에 가장 돈을 많이   있는 기계를 알아내야 합니다. M1부터 M5까지 슬롯머신마다 각각의 distribution 값을 보게 되면 어떤 기계가 가장 돈을 많이   있는 기계인지   있습니다 사실만  알게 된다면 게임을 하는 사람은  기계에만 계속 배팅을 하고 가장 이득이되는 결과를 갖게  것입니다.
 하지만 어떤 기계가 좋은 결과를 보여주는지 찾는 동안에도 계속해서 돈을 써야 하고 잃어야 합니다어떤 기계에서 돈을   있는   아는 데까지 시간이 많이 걸린다면 확률이 낮은 기계에 돈을 계속 쓰게 되고  사이에 가진 돈을 모두 잃게   모릅니다.

 따라서 이렇게 슬롯머신 게임을 하면서  가지의 개념이 필요하게 됩니다
Exploration(탐험하기) exploitation(뽑아먹기)
1)      어떤 기계에서 가장 돈을 많이   있는지 빠른 시간 안에 알아야 한다(exploration)
2)      동시에 현재 알고 있는 가장 돈을 많이   있는 기계에서 최대한 빨리 돈을 계속 따야 한다(exploitation)
 
또한 여기서 regret이라는 수학적 개념이 나오게 됩니다.
한쪽은 optimal machine 돈을 계속 넣어서 돈을 따게 되었지만 다른 한쪽은non-optimal machine 돈을 계속 넣어서 많은 돈을 잃게 되었다면 best outcome non-best outcome 사이의 차이가 regret개념이 됩니다.
 Optimal machine 찾기 위해 다른 기계들을 exploration하는데 쓰이는 비용을 opportunity cost라고 하며 다른 non-optimal machine들을 explore하는 시간이 길면 길수록 높은 reget값을 가질  있습니다빠른 시간 안에 explore하면서 sub-optimal machine 찾고(exploration)   기계에서 계속 돈을 따면서( exploitation) 최소한의 시간 안에 optimal machine 찾아 내야 합니다
(짧은 시간 안에 찾은 sub-optimal distribution 정말 optimal distribution인지 검증이 필요합니다섣부른 판단으로 sub-optimal optimal이라고 판단할 수도 있습니다
 
정리를 한다면The multi-Armed Bandit model 목적은 best one 찾고(exploration)  best one에서 돈을 따고(exploitation) best one 찾는 시간을 최소화 하는 것입니다.


:

The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란?

광고/용어 2018. 2. 28. 11:40

 Reinforcement learning 쉬운 예를 들어본다면 robot dog에게 걷기 연습을 시키는 algorithm입니다. Robot dog에게 우측 앞발을 움직이고 다음에 좌측 뒷발을 움직이고  다음으로 좌측 앞발을 움직이게 프로그래밍을 하고 실제적으로 연속적으로 수행하도록   있습니다 다른방법으로  Reinforcement learning algorithm 이용하여 robot dog 걷도록 training시킬  있습니다기본적으로 robot dog에게 모든 가능한 action tool 들에 대해 알려줍니다이렇게도 움직일  있고 저렇게도 움직일  있다는 정보를 줍니다그리고 robot dog 목표는 앞으로 나아가는 것이라고 알려줍니다앞으로 나아가는  순간마다 reward 받고 넘어지는 순간마다 punishment 받습니다당근이나 간식을 주는 것은 아니고 algorithm에서  reward  1이고 punishment 0 입니다기본적으로 robot dog 모든 가능한 random sets action 시도하게 되고  순간 1  0  평가를 받게 됩니다. Machine 이러한good action들을 기억하게 되고 반복함으로써 실제로 개가 걷는 것처럼 앞으로 걸을  있게 됩니다.
 
Multi-Armed Bandit Problem 무엇일까요?
기본적인 가정을 두가지 해보도록 하겠습니다.
1)      우리는 세상에 대해  모른다.
2)      세상은 계속 변한다.
Machine learning에서 지도학습이란  모르는 세상에 대해 기존의 지식을 training하고 일반화를 통해 최적화된 모델을 만드는 것이지만  모든 일반화된 모델 역시  번째 가정 세상은 계속 변한다에 의해 지속적으로 업그레이드 되어야 하는 경우가 발생하게 됩니다.
이때 필요한 중요한 개념은
Exploration(탐험하기) : 최적 안을 결정하기 위해 다른 안들을 계속 평가하는 
Exploitation( 뽑아먹기)최적 안이 나왔다면 이곳으로 사용자를 몰아주고 최대의 이익이 나올  있도록 하는 .
반복적으로  검증가능한 현상을 과학이라고 부르지만 비즈니스 환경 등에서는 계속되는 변화 속에 있고 추세의 변화를 빠르게 찾아낼 필요가 있게 됩니다얼마만큼의 시간과 재화의 투자를 exploration(탐험하기) 몰아주고 얼마만큼의 시간과 재화를 exploitation(뽑아먹기) 몰아주어야 이익이 최대가  것인가를 알고 또한 시간의 흐름에 따라 얼마의 비중으로 exploration exploitation 비율을 바꾸어갈지 판단해야 하며 이는 어려운 문제가 됩니다이와 같은 딜레마의 대표적인 예가 multi-armed bandit problem입니다.
 


'광고 > 용어' 카테고리의 다른 글

The multi-Armed Bandit Problem이란? #2  (0) 2018.02.28
더치 옥션 (Dutch auction)  (0) 2018.02.28
비커리 경매(Vickery Auction)  (0) 2018.02.28
CTR (Click-through rate)  (0) 2018.02.28
:

더치 옥션 (Dutch auction)

광고/용어 2018. 2. 28. 10:43

두산백과

더치 옥션

[Dutch auction음성듣기]

요약 매도자가 최고 호가로부터 점차 가격을 낮추어 가다가 매수 희망자가 나오면 최초의 매수 희망자에게 매도하는 경매 가격결정 방법.

네덜란드식 경매라고도 한다. 일반적으로 경매는 최저 호가로부터 점차 가격을 높여 가다가 최고 호가의 매수 희망자, 곧 마지막 매수 희망자에게 매도하는 방식을 취한다. 그러나 더치 옥션은 이와는 반대로 매도자가 최고 호가로부터 점차 가격을 낮추어 가다가 매수 희망자가 나오면 최초의 매수 희망자에게 일괄 매도하는 가격결정 방법이다.

이는 채권을 매각할 경우에도 마찬가지로 적용된다. 즉 경매에 참여한 매수 희망자가 자신이 떠안을 수 있는 물량과 가격 조건을 제출하되, 최저 금리를 제시한 물량부터 차례로 채우다가 마지막 물량을 떠안은 매수 희망자가 제시한 금리로 물량을 떠안는 제도를 말한다. 다시 말해 채권을 입찰에 부치되 경매 참여자가 써 낸 금리 가운데 최고치로 발행액 전액을 매각하는 방식이 더치 옥션이다.

1997년 국제통화기금(IMF외환위기 당시 외국 금융기관(채권은행)들은 한국의 단기외채 250억 달러를 중장기로 전환할 경우 적용하는 금리를 이 방식으로 결정하자고 제안하였으나, 한국 정부에서는 당사자 협의방식을 주장해 더치 옥션은 수용되지 않았다.

[네이버 지식백과] 더치 옥션 [Dutch auction] (두산백과)


출처 - http://terms.naver.com/entry.nhn?docId=1222336&cid=40942&categoryId=31721


:

비커리 경매(Vickery Auction)

광고/용어 2018. 2. 28. 10:42

잠재적 구매자는 입찰가를 비밀리에 제출하고, 가장 높은 가격을 제시한 사람이 경매에서 이기지만 자신의 입찰가가 아니라 제출된 가격 중 두번째로 높은 가격을 지불한다.

:

CTR (Click-through rate)

광고/용어 2018. 2. 28. 10:26

클릭률

[Click-through rate]

약어CTR

온라인 광고의 노출횟수 대비 클릭 수를 의미한다. 배너광고가 노출된 횟수(Impression) 중, 실제 클릭을 통해 배너광고에 연결된 웹페이지(웹사이트)로 이동한 경우의 비율을 일컫는다. 어떤 온라인 광고의 웹페이지 게재 횟수(노출된 횟수, impression)가 100번이고, 그 광고 클릭 횟수가 1번이면 CTR(CTR=(클릭 수/ 노출된 횟수)×100)은 1%라는 얘기가 된다. 온라인 광고 효과를 측정하는 데 있어 CTR은 중요 지표다. 웹사이트의 방문자를 광고주가 원하는 최종 웹페이지까지 이동하도록 클릭을 유도하는 데 성공한 광고라면, 방문자의 호기심을 자극하는 데 성공했다고 볼 수 있기 때문이다.

현재 온라인상 광고 클릭률(CTR)은 대략 0.2%~0.3%로 매우 낮은 편이나, 아직 그 어떤 예측 분석 솔루션도 어느 광고 캠페인이 어떤 개인으로부터 최고의 클릭률을 유도할 수 있는지 식별하지 못한다. 광고 클릭 과정은 변덕스러우며, 대개 광고를 접할 당시 개인의 기분 과 요구사항이 반영되는 경우가 많다. 전반적으로 모바일 기기가 PC보다 더 높은 배너광고 클릭률을 기록했다. 안드로이드 기기의 평균 클릭률은 PC의 두 배로 나타나 전 세계적으로 안드로이드 기기에서 더 많은 매출이 발생했다.

반면, 미국과 유럽에서는 iOS 기기 매출이 안드로이드를 앞서는 것으로 조사되었다. 모바일 기기는 PC 사용량을 보완하여 추가적인 매출을 창출한다. 일례로 일요일에 발생하는 전자상거래 중 아이패드 내 구매율은 16% 더 높은 반면, 데스크톱 내 구매율은 10% 낮아진다고 발표했다. 또한 모바일 기기에서 가장 높은 평균 구매가는 호텔 및 렌터카 예약과 의류구매에서 발생했으며 각각 약 365달러, 209달러, 105달러(한화 약 36만원, 22만 원, 11만 원)로 조사되었다.


출처 - http://terms.naver.com/entry.nhn?docId=3586054&cid=59277&categoryId=59282


: