스스로 생각하는 힘
명령 따르기를 넘어 개가 스스로 판단·문제해결·소통하게 키우는 훈련. 프리쉐이핑·do as i do 모방·개념 훈련·말 버튼·노즈워크를 능력 축으로 분류 — JEAB·Animal Cognition 1차 근거. 집중을 금방 잃을 때 조절법까지.
목차 펼치기
1. ‘명령 따르기’와 ‘스스로 생각하기’는 다른 훈련이다
자기주도 사고는 복종과 별개의 능력이다. 복종 훈련은 사람이 무엇을·언제 할지 결정하고 개는 그 신호에 반응한다. 자기주도 사고 훈련은 그 결정권의 일부를 개에게 넘긴다. 두 훈련을 가르는 축은 통제 소재— 행동의 출발점이 사람의 신호에 있는가, 개 자신에게 있는가다. 유인 없이 스스로 행동을 내놓게 두는 방식에서 개는 ‘내가 뭘 하면 보상이 오지?’를 스스로 풀어야 하고, 숨긴 냄새를 찾을 때는 발원점을 아는 유일한 주체가 개의 코다. 이렇게 통제 소재가 개에게 있을 때 개는 수동적 추종이 아니라 능동적 가설검증을 한다.
토대가 되는 사실은, 개의 일부 인지 능력은 훈련 없이도 내재한다는 것이다. 무훈련 개 11마리 중 8마리의 두정측두엽이 점 배열을 보기만 했는데 영장류와 같은 수량 비율 의존 반응을 보였다 — 수 감각은 가르쳐 넣는 게 아니라 이미 있는 것을 출력으로 끌어내는 작업이다. 처음 듣는 단어를 아는 사물들 사이에서 골라내는 배제 추론, 안 보이는 대상이 계속 존재함을 표상하는 대상 영속성도 측정 패러다임에서 관찰됐다. 그래서 이 글의 훈련들은 ‘없는 지능을 새로 만든다’기보다, 내재한 추론·기억·소통 능력을 행동으로 꺼내고 넓히는 방식으로 작동한다.
단, 같은 현상을 두고 학계는 기저 기제가 표상적이냐 연합적이냐에서 갈린다. 포인팅 이해를 가축화로 선택된 능력으로 보는 쪽(Hare·Miklósi 계열)과 개체발생적 조건화의 산물로 보는 쪽(Udell·Wynne 계열)이 충돌하고, 대상 영속성·배제 추론도 ‘정신적 표상이냐 단순 연합 휴리스틱이냐’가 미결이다. 다만 두 해석 모두 ‘개가 새 정보를 도출한다’는 현상 자체는 인정한다.
2. 능력 축으로 본 프레임워크
각 프레임워크는 서로 다른 인지·소통 능력을 키운다. 아래는 어떤 훈련이 어떤 능력을 겨냥하는지와, 행동의 출발점(통제 소재)이 개에게 있는지 사람에게 있는지를 정리한 것이다. 통제 소재가 개 쪽일수록 자기주도 사고를 직접 겨냥한다.
| 키우는 능력 | 프레임워크 | 통제 소재 | 무엇을 하나 |
|---|---|---|---|
| 스스로 행동을 만들어내기 | 유인 없이 스스로 행동을 내놓게 두는 방식 (free shaping·capturing) | 통제 소재: 개 | 사람이 유인하지 않고 개가 먼저 행동을 시도하면 그중 목표 방향만 표시해 강화한다. 문제해결·행동 변산·창의를 직접 겨냥. |
| 모방·사회적 학습 | 사람이 한 행동을 그대로 따라 하게 하기 (Do As I Do) | 통제 소재: 개·사람 | '방금 본 것을 따라 하라'는 추상 규칙을 먼저 심은 뒤, 시범 한 번으로 새 행동을 습득시킨다. 관찰·표상·기억의 인지 파이프라인을 훈련. |
| 개념·규칙 추상화 | 여러 상황에 적용되는 규칙을 가르치기 (concept training) | 통제 소재: 개·사람 | 왼쪽/오른쪽·큰/작은 같은 수식어, 같은 것 고르기, 수량 변별을 3~5개 행동에서 익혀 학습한 적 없는 조합에도 규칙을 전이. |
| 언어·상징 소통 | 사물 이름과 말 버튼으로 단어 다루기 (word labels·AAC buttons) | 통제 소재: 개·사람 | 사물마다 음성 라벨을 결합하고, 처음 듣는 단어를 배제 추론으로 골라내게 한다. 말 버튼은 개가 단어를 누르는 출력 채널을 연다. |
| 자기주도 탐색 | 숨긴 냄새를 코로 스스로 찾게 하기 (nosework·scent work) | 통제 소재: 개 | 사람도 개도 위치를 모르는 상태에서 개가 농도 구배를 역추적한다. 통제권이 사람에서 개로 역전되는 자기주도 문제해결. |
| 의사결정·주도권 | 처치를 개가 시작·중단하게 하기 (agency·start-button) | 통제 소재: 개·사람 | 정해진 신호 행동이 사람의 다음 동작을 켜고 끈다. 개가 케어의 속도를 통제하는 의사결정자가 된다. |
| 자극을 보고 보호자에게 보고 | 자극을 보고 보호자에게 알리게 하기 (Look At That) | 통제 소재: 개·사람 | 자극을 보는 행동 자체를 강화해 '위협'을 '보호자에게 알리고 보상받는 신호'로 재정의한다. 정서반사를 인지 상태로 전환. |
각 프레임워크의 정의·훈련 단계·근거는 아래 섹션에서 하나씩 푼다. 학파가 갈리는 지점은 효과 데이터로만 적었고, 음식 동기 조절·압박·negative reinforcement를 쓰는 설계는 어느 쪽이 옳다는 판정 없이 두 입장의 차이만 기록한다.
3. 스스로 행동을 만들어내는 훈련
행동의 출발점을 사람이 아니라 개에게 두면, 개는 '무엇을 하면 보상이 오는가'를 시행착오로 추론한다.
정의
유인 없이 스스로 행동을 내놓게 두는 방식(free shaping)은 명령·유인·신체 조작 없이 개가 다양한 행동을 시도하게 두고, 목표에 가까운 행동을 클리커 같은 마커로 정확히 표시해 강화하는 절차다. 개가 이미 하는 행동(하품·기지개)을 그 순간 잡아 강화하는 포착(capturing)이 가장 쉬운 진입이다. 반대 설계인 무오류 학습(errorless learning)은 오답에 반응할 일이 없도록 환경을 설계해 개가 틀리지 않고 정답에 도달하게 한다.
키우는 능력
문제해결, 행동 변산과 창의, 의사결정·주도성. 한 행동이 더는 강화되지 않으면 개는 새 행동을 꺼내고, 그 변산 중 목표 방향을 골라 다시 좁히는 탐색-수렴 반복이 곧 문제해결 과정이다.
훈련 단계
- 마커를 충전한다 — 조용한 곳에서 클릭 후 즉시 간식을 10~20회 반복해, 개가 클릭 소리에 보상을 기대하게 만든다.
- 빈 상자 하나를 바닥에 두고 사람은 떨어져 앉아 기다린다. 목표 행동을 미리 정하지 않는다.
- 상자와 관련된 아주 작은 행동(쳐다보기·다가가기·발로 건드리기)이라도 클릭하고 보상한다. 이 단계에선 무작위 행동도 환영한다.
- 한 행동이 자리잡으면 그 클릭을 멈추고 더 발전된 행동을 기다린다 — 한 번에 한 단계씩 기준을 올린다.
- 막히면 그 행동 클릭을 끊고 다른 무언가가 나올 때까지 기다린다. 비강화가 변산을 끌어내 다음 근사치의 재료가 된다.
- 행동이 안정적으로 반복될 때 비로소 이름(cue)을 붙인다. 행동이 신뢰성 있게 나오기 전에 이름을 붙이면 불완전한 행동에 신호가 묶인다.
근거
변산성과 새로움 자체를 강화하면 창의가 훈련된다는 핵심 증거는 1969년 돌고래 실험이다 — '이전에 안 나온 새 행동만' 강화하자 두 마리가 그 종에서 관찰된 적 없는 새 동작을 연달아 발명해 냈다. 개 대상 통제연구는 더 신중하다. naive 개를 sit-and-stay로 shaping한 비교에서 클리커가 음성 마커·먹이 단독을 일관되게 능가하지는 못했고(단순·짧은 과제에서 마커의 추가 이점은 작거나 미검출), 부분 강화(60%)는 학습 속도를 개선하지 못한 채 애매 자극에 더 느리게 접근하는 비관적 정서 편향을 유발했다. 즉 새 행동 습득 단계에서는 강화율을 높게 유지하는 편이 학습 손해 없이 정서 비용을 줄인다.
4. 보고 따라 하는 훈련
개를 우연한 행동을 강화당하는 출력 장치가 아니라, 사람의 행동을 관찰·표상·기억하는 해석자로 세운다.
정의
사람이 한 행동을 그대로 따라 하라는 추상 규칙을 먼저 가르친 뒤(Do As I Do), 이 규칙을 지렛대 삼아 시범만으로 새 행동을 습득시키는 사회적 학습 훈련이다. 개별 시행착오가 아니라 타자의 행동을 관찰·표상·재현하는 경로로 학습한다.
키우는 능력
진짜 모방(동작 형태를 자기 몸으로 옮기기), 추상 규칙의 일반화, 지연 모방과 선언적 기억, 선택적 모방(무엇을 따라 하고 무엇을 버릴지 고르는 의사결정).
훈련 단계
- 언어 큐만으로 수행하는 행동을 최소 3가지 확보한다. 신체 프롬프트·시선 단서가 섞이면 개가 시범이 아니라 사람의 미세 동작을 단서로 삼아 규칙이 오염된다.
- 개를 마주 세워 정지시킨 뒤 사람이 직접 그 행동을 시범한다(엎드리기·버튼 누르기 등).
- 시작 위치로 돌아와 'Do it!' 큐를 준다. 개가 맞게 따라 하면 클릭·보상·칭찬, 엉뚱하면 보상 없이 리셋한다.
- 시범 행동의 순서를 무작위로 섞어, 개가 직전 큐가 아니라 방금 본 시범에 반응하도록 강제한다.
- 아는 행동 3가지를 더 추가해 개가 특정 행동 목록이 아니라 따라 하기 규칙을 익히게 한다.
- 한 번도 훈련한 적 없는 새 행동을 시범하고, 개가 모방하면 즉시 강화하고 새 언어 큐를 부여한다.
근거
개가 모방으로 배운 행동을 운동 연습 없이 지연 후 재현한다는 것이 선언적 기억의 첫 증거로 보고됐다 — 친숙 행동은 0.40~10분 지연 후에도, 신규 행동은 약 1~1.5분 지연 후 재현됐다(성견 8마리). 자기 자신의 자발 행동까지 사후 회상하는 확장 검증에서는 무지연 회상 약 70%가 1시간 후 약 30%로 감소해, 에피소드 기억 특유의 감쇠 패턴을 보였다. 효율 비교에서는 물체 관련 행동 학습에서 do as i do가 shaping·클리커보다 24시간 후 회상이 더 좋았으나, 물체·목표가 없는 순수 신체 동작(공중 점프)에서는 우위가 제한적이었다. 다만 핵심 인지 주장은 N=8~38 소표본에 기댄 것이라 '개 일반이 항상 그렇다'는 일반화는 표본 한계상 추정이다.
5. 규칙·개념을 가르치는 훈련
개에게 '무엇을 하라'가 아니라 '어떻게 판단하라'를 가르치면, 학습한 적 없는 새 조합에도 규칙을 스스로 적용한다.
정의
특정 신호와 특정 행동의 1:1 매핑이 아니라, 여러 상황에 적용되는 규칙(rule)을 가르치는 훈련군(concept training)이다. 같은 수식어(예: 왼쪽)를 여러 다른 행동에 얹어 가르치면 개는 행동에 무관한 공통 속성(왼쪽이라는 방향성)을 추출할 수밖에 없고, 이 추출이 곧 추상화다. 같은 것 고르기(match-to-sample)는 자극 간 관계를, 수량 변별(counting)은 개수를 추상 속성으로 다룬다.
키우는 능력
추상화와 규칙 일반화, 관계적 판단, 수량 변별, 따로 배운 두 행동을 합쳐 새 행동을 즉석 생성하는 창발적 조합(adduction).
훈련 단계
- 마커 이해·신호 유창성·shaping 경험·둔감화·일반화 경험 같은 토대를 먼저 갖춘다. 이 토대가 없으면 개념 단계에서 오류가 폭증한다.
- 수식어를 첫 행동에 부착한다 — 예: 왼쪽/오른쪽을 표적 터치에 음성 큐만으로 구분해 적용.
- 같은 수식어를 전혀 다른 행동(예: 두 켄넬 중 왼쪽으로 들어가기)으로 확장한다.
- 3~5개 행동까지 반복해 수식어를 서로 무관한 여러 행동에 얹어 숙달시킨다.
- 훈련한 적 없는 새 행동에 그 수식어 큐를 줘서, 개가 스스로 적용하는지(전이) 확인한다.
- 수량 변별은 트레이를 보고 같은 개수의 점 보드를 고르게 하되, 사람이 트레이 속 개수를 못 보는 이중맹검으로 무의식적 단서(Clever Hans)를 차단한다.
근거
개념 훈련이 전제하는 인지능력은 독립 연구로 입증돼 있다. 수 감각은 훈련 없이도 내재한다 — 무훈련 개 11마리 중 8마리의 두정측두엽이 점 배열을 보기만 했는데 영장류와 같은 수량 비율 의존 반응을 보였고, 면적을 통제해 '크기가 아니라 수'임을 확인했다. 시각 범주화 연구에서는 개가 개 사진과 풍경을 변별하도록 학습한 뒤 새 사진으로 전이했고, 모순 자극에도 무너지지 않아 개별 항목이 아닌 범주 기반 응답 규칙을 쓰는 것으로 나타났다. 모방·개념의 효율은 과제 복잡도로 갈린다 — 단순 과제는 do as i do와 shaping의 차이가 없으나 복잡·시퀀스 과제에서는 do as i do가 빨랐다. 단, Ramirez의 counting·mimicry 프로젝트 자체는 동료심사 출판 전이라 위 연구들은 직접 검증이 아닌 수렴 증거로 읽어야 한다.
6. 말을 알아듣고 표현하기
이름과 단어 버튼은 개에게 상징을 다루게 한다 — 외운 반응을 꺼내는 게 아니라, 미지의 자극을 기존 지식으로 분류하는 연역을 매 시행 시킨다.
정의
두 방향이 있다. 받아들이는 쪽은 사물마다 고유한 음성 라벨을 결합시키고, 처음 듣는 단어를 이미 이름을 아는 사물들 사이에서 배제 추론으로 골라내게 하는 단어-사물 라벨 학습이다. 표현하는 쪽은 발로 누르면 녹음된 단어가 재생되는 버튼 보드(AAC, 보완대체의사소통)를 주고 보호자가 모델링으로 시연해, 개가 자기 욕구를 단어로 표현하게 하는 말 버튼 훈련이다.
키우는 능력
단어가 행동이 아니라 사물을 가리킨다는 지시 인식, 배제에 의한 추론, 고유명사와 범주의 구별, 그리고 내부 상태를 임의 기호로 변환하는 표현 의도와 조합.
훈련 단계
- 라벨 학습: 하루 1~2개 이름만 가르친다. 새 사물을 가리키며 일관된 이름을 말하고, 바닥에 다른 사물이 없게 해 오류가 거의 안 나오게 한다.
- 가져오면 놀이·관심으로 보상하고, 3~5분간 그 이름을 반복 발화해 이름-사물 연합을 굳힌다. 새 사물을 최근 배운 것들 사이에 깔아 간격 리허설한다.
- 배제 시행: 친숙 사물 7개 + 새 사물 1개를 깔고 처음 듣는 새 이름을 부른다. 개가 아는 것들을 소거하고 남은 새 물건을 골라야 한다.
- 말 버튼: 하루에 자주 쓰는 기능어 1개(보통 'outside')부터 고르고, 결과가 실제 일어나는 장소(현관 옆)에 버튼을 둔다.
- 결과가 일어나기 직전에 단어를 말하며 직접 버튼을 누른다(모델링). 자리잡으면 질문 뒤 10~15초 침묵해 개가 스스로 누를 산출 기회를 준다.
- 개가 스스로 누르면 즉시 그 결과를 제공한다. 누른 뒤 결과를 안 주면 기호 신뢰도가 깨져 개가 버튼을 포기한다.
근거
라벨 학습의 상한은 border collie Chaser에서 3년간 1,022개 고유명사 학습·32개월 보존으로 보고됐다(이중맹검 145회에서 20개 중 18개 밑으로 떨어진 적 없음). 다만 배제로 새 단어를 처음 골라내는 것과 오래 기억하는 것은 별개 능력이다 — Chaser조차 추가 리허설이 없으면 배제로 얻은 이름이 24시간을 넘기지 못했고, 한 연구에서는 사회적 놀이 노출에서는 학습됐지만 동일 4회 배제 노출에서는 부호화되지 않았다. 말 버튼 쪽 통제 실험(개 30마리)에서는 'play' 조건에서 놀이 관련 행동이 약 7배, 'outside' 조건에서 관련 행동이 약 7배 늘었고, 버튼을 누른 사람이 보호자인지 낯선 실험자인지에 따른 차이가 없어 개가 사람 단서가 아닌 단어 자체에 반응함을 시사했다. 두 버튼 조합 분석(개 152마리, 누름 194,901건)은 조합이 무작위로 설명되지 않음을 보였으나(비우연·비무작위·비모방), 연구진은 이것이 진정한 referential 이해인지 연합 학습인지를 단정하지 않았다. 강력 학습자가 대부분 border collie인 점에서, 한두 천재 개체의 성취를 모든 개로 일반화하는 것은 1차 출처도 경계한다.
7. 코로 스스로 푸는 훈련
숨긴 냄새를 찾는 동안 통제권이 사람에서 개로 넘어간다 — 발원점을 아는 유일한 주체가 개의 코다.
정의
개가 숨겨진 목표 냄새를 스스로 찾아내도록 두고, 사람은 명령으로 통제하는 대신 개의 몸짓을 읽고 따라가는 훈련(nosework·scent work)이다. 사람도 개도 위치를 모르는 상태에서 시작하므로 사람이 개를 이끌 수 없고, 정보 비대칭이 개에게 유리하게 뒤집힌다. 냄새는 공기 흐름에 따라 고여 발원점에서 떨어진 곳에 가짜 정점을 만들기 때문에, 개는 '가장 강한 곳이 발원점이 아닐 수 있다'는 상황을 끊임없이 마주하며 가설을 수정한다.
키우는 능력
자기주도 문제해결, 의사결정·자율성, 냄새를 의미 있는 기호로 처리하는 후각 인지, 그리고 개의 미세 신호를 읽는 사람-개 커뮤니케이션.
훈련 단계
- 사전 조건이 없다 — 복종 훈련·핸들러 경험이 불필요하고 모든 견종·연령에 열려 있다. 오히려 복종을 강하게 받은 개가 스스로 결정하길 주저해 초반에 느릴 수 있다.
- 좋아하는 음식을 열린 상자 하나에 넣고 약 1m 떨어뜨려 둔 뒤, 'Go find it' 같은 프롬프트로 개를 풀어 탐색하게 한다. 사람은 위치를 알려주지 않고 개가 코로 찾을 때까지 기다린다.
- 발원 상자를 빈 상자 사이에 섞어 변별 부하를 더한다. 발원 상자는 항상 같은 상자를 써서 냄새가 다른 상자에 묻는 오염을 막는다.
- 상자를 멀리·복잡한 위치에 두어 난도를 올린다. 3연속 성공한 뒤에만 다음 단계로 올린다.
- 음식 옆에 목표 냄새(birch·anise·clove 오일을 묻힌 면봉)를 함께 둬 '이 냄새 = 음식'을 학습시킨 뒤, 음식을 빼고 냄새만 두고 개가 찾으면 사람이 보상을 가져다준다.
- 개가 발원점을 찾았을 때의 자연 행동(앉기·코로 가리키기 등)을 읽는 법을 익힌다. 팀이 실패하는 것은 대개 개 코가 아니라 사람이 개를 못 읽어서다.
근거
후각 탐색이 자율성을 높인다는 통제 데이터가 있다 — 2주간 nosework를 한 개는 모호 자극에 더 빨리 접근(낙관 편향이 증가, 평균 4.74초에서 3.40초로 단축, p<0.01)했고, 같은 양의 음식·운동·사람 시간을 받았으나 후각 요소가 없는 복종 훈련 군은 변화가 없었다. 저자들은 차이를 만든 것이 음식이나 운동이 아니라 개가 스스로·자기 주도로 행동하게 한 점이라고 본다. 더 근본 원리로, 비글 실험에서 스스로 과제를 푼 개는 흥분(꼬리치기) 신호를, 같은 보상을 그냥 받은 개는 좌절(장치 물어뜯기) 신호를 보여 — 보상이 아니라 '내가 풀었다'는 통제 경험 자체가 긍정 정서를 만들었다. 다만 반려견은 후각이 가능해도 win-stay 같은 규칙 전략을 우선하기도 해(원거리에서), 후각을 명시적으로 끌어내는 활동이 따로 필요하다.
8. 결정권을 주는 훈련
개를 처치의 수동적 대상에서 절차를 시작·중단시키는 통제자로 바꾸면, 같은 자극에 대한 스트레스 반응이 낮아진다.
정의
케어·핸들링 절차를 개가 시작·계속·중단시킬 수 있는 관찰 가능한 신호 행동(start-button behavior)을 가르쳐, 처치가 개의 동의 하에서만 진행되게 만드는 훈련(협력적 케어)이다. 개의 특정 행동이 사람의 정해진 다음 동작을 켜는 변별 자극이자 그 자체로 강화되는 행동이 된다. 개가 신호를 빨리·끈질기게 내면 그 절차가 강화물로 기능하고, 지연되거나 안 나오면 개가 '아니오'를 말하는 것 — 즉 개의 행동 자체가 선호의 측정 가능한 데이터가 된다.
키우는 능력
내 행동이 사람을 바꾼다는 인과 추론(통제감), 매 순간의 의사결정, 개에서 사람으로 향하는 신호 채널, 그리고 스스로 감당 가능한 속도로 노출을 조절하는 자기 진정.
훈련 단계
- 신호 행동을 처치와 무관하게 먼저 깨끗이 강화한다 — 예: 통을 바라보면 보상해 응시를 약 10초+까지 늘리거나, 턱을 손바닥에 올리는 chin rest를 안정화한다.
- 신호 행동이 유지되는 동안에만 아주 작은 한 동작(손을 천천히 개 쪽으로, 발 살짝 들기)을 시작한다. 시선을 떼거나 턱을 떼면 즉시 그 동작을 거둔다.
- 신호 행동이 빠르고 끈질기게 유지되는지(latency·persistence)로 절차가 강화물로 기능하는지 확인한다.
- 한 번에 한 변수만 강도·지속을 올린다. 신호가 끊기면 강도를 낮추거나 직전 단계로 후퇴하고, '거부'를 처벌하지 않고 설계 피드백으로 쓴다.
- 발톱깎기·점안·양치 같은 실제 처치에 같은 구조를 전이한다. 멈출 수 없는 응급 처치에는 이 게임을 쓰지 않는다.
근거
근거의 다수는 개가 아닌 종·인간 또는 일반 복지 이론에서 온 것이라, start-button 프로토콜 자체를 무작위 대조로 검증한 동료심사 연구는 빈약하다 — 인지 효용은 수반성·통제·선택의 일반 원리에서 연역된 강한 추정이다. 그 원리는 이렇다. 선택 기회를 예고하는 단서를 사람이 더 선호했고 선택의 기대만으로 보상 회로(복측 선조체)가 활성화됐다(선택 자체가 보상). 소음을 레버로 차단할 수 있던 원숭이는 통제권 없던 원숭이보다 cortisol이 낮았다(통제가 스트레스 생리를 낮춤). 반대로 회피 불가능한 충격에 반복 노출된 개는 이후 회피 가능한 상황에서도 시도를 포기했다(통제 박탈이 학습·문제해결을 무너뜨림). start-button은 개에게 통제권을 돌려주는 설계로 이 방향을 뒤집는다.
9. 사람과의 대화로 바꾸기
자극을 보는 행동 자체를 강화하면, 개는 자극 앞에서 폭발하는 대신 보호자에게 '저기 개 있어'라고 알리고 응답을 받는 양방향 대화로 바꾼다.
정의
개가 자극(trigger)을 보는 행동 자체를 마커로 강화해, 자극을 '반응해야 할 위협'이 아니라 '보호자에게 알려주고 보상받는 신호'로 재정의하는 게임(Look At That)이다. 개는 자극을 보고 보호자를 돌아보는 행동을 학습하며, 그 과정에서 자극에 대한 정서반응이 부정에서 긍정으로 바뀐다. 자극 출현이 항상 좋은 것과 짝지어지는 고전적 측면과, 돌아보기가 짖기·달려들기와 양립 불가능한 대체행동으로 자리잡는 조작적 측면이 함께 돈다.
키우는 능력
정서적 자기조절(정서반사에서 사고 상태로 전환), 자극에서 스스로 시선을 떼는 선택, 환경 정보를 보호자에게 전달하는 양방향 소통, 자극의 인지적 재범주화.
훈련 단계
- 역치 아래로 세팅한다 — 개가 자극을 반응 없이 알아챌 수 있는 거리를 확보한다. 너무 가까우면 실내에서 중립 대상(콘·녹음된 소리)으로 먼저 연습한다.
- 평소 안 주는 고가치 보상(닭고기·치즈)을 잘게 준비한다.
- 개가 자극을 보는 바로 그 순간 마크하고 트리트를 준다. 트리트는 개가 자극에서 시선을 떼도록 전달해 다시 볼 준비를 시킨다.
- 처음엔 빠르게 연사처럼 반복한다 — 트리트 5~10개를 쓰고 1~2분 쉰다. 짧고 긍정적으로 끊는다.
- 개가 자극을 기대하며 차분히 보게 되면 거리를 조금씩 좁힌다. 긴장·반응이 시작되면 반대 방향으로 빠진다.
- 개가 이미 흘끗거릴 때 'Look!' 큐를 얹는다. 이후 큐로 개가 자극을 보고 보호자에게 돌아오게 된다.
근거
Look At That 게임 자체를 단독으로 무작위 대조한 연구는 확인되지 않아, 근거는 구성요소 수준으로 제시된다. 둔감화+역조건화 프로그램은 4주 적용 시 동물병원 공포에서 훈련군의 공포 점수 중앙값이 2(대조군 3, p=0.046)로, 순응한 보호자의 86.7%가 개선을 보고했으나 저자들은 'mildly effective'로 신중히 결론지었다. 통제감이 스트레스를 낮춘다는 토대도 있다 — 가상울타리 실험에서 예측·통제 가능한 양은 cortisol·체온이 대조군과 차이가 없었으나, 예측은 가능하되 통제 불가능한 양은 상승했다(sheep 모델). 그 뿌리인 고전 실험에서 통제 불가능한 충격을 받은 개는 이후 탈출 가능한 상황에서도 탈출을 학습하지 못했고, 결정적 변인은 자극의 강도가 아니라 통제가능성이었다.
10. 집중을 금방 잃을 때
개가 신나지 않고 금방 집중을 잃는 것은 대부분 세 변수로 진단된다 — 강화 밀도(짧은 시간에 보상이 얼마나 자주 오는가), 기준 크기(한 번에 올리는 난도가 얼마나 큰가), 세션 길이다. 자기주도 훈련은 개가 계속 자발적으로 시도하는 상태 위에서만 작동하므로, 시도가 멈추면 이 변수부터 조절한다. 핵심 운영 원리는 개가 옳을 확률을 높게 유지하는 것 — 그것이 정서 안정과 능동적 탐색 사이의 균형을 결정한다.
| 증상 | 원인 | 조절 |
|---|---|---|
| 행동을 아예 안 내놓고 굳는다 (shut-down) | 과거에 '틀리면 혼났다'는 이력이 있거나, 강화율이 낮아 좌절한 상태. | 기준을 극단적으로 낮춘다 — 쳐다보기만 해도 클릭한다. 위축된 개·구조견에게 빈 상자 포착 훈련을 권하는 이유가 이것이다. |
| 한 행동만 무한 반복한다 | 기준을 너무 빨리 올렸거나(lumping), 비강화 구간에서 반복 고착에 빠졌다. | 단계를 잘게 쪼갠다(splitting) — 한 번에 한 단계씩. 반복에 빠지면 그 행동 클릭을 끊되 완전 소거까지 밀지 말고 가끔 이전 행동을 섞어 시도를 유지한다. |
| 트리트를 안 먹고 자극에 고착한다 | 자극이 너무 가깝거나 강하다 — 역치를 넘은 '학습이 안 되는 뇌 상태'. 음식 거부 자체가 역치 초과의 진단 신호다. | 즉시 거리를 벌려 역치 아래로 되돌린다. 이때 유일한 목표는 다시 below threshold로 가는 것이다. |
| 짖음·물기·이탈 같은 좌절 반응이 터진다 | 클릭을 너무 오래 끊어 소거 좌절(extinction burst)에 도달했다. 정서가 부정으로 가면 탐색이 멈춘다. | 강화율을 다시 높인다. 새 행동 습득 단계에서는 부분 강화보다 높은 강화율이 학습 손해 없이 정서 비용을 줄인다(부분 강화 연구). |
| 보상에 흥미가 없다 / 신나지 않는다 | 보상가가 낮거나 이미 배가 부르다(satiation). 시범자가 신뢰·유대 대상이 아닐 때도 모방·소통 동기가 떨어진다. | 더 높은 가치의 보상, 집중이 오르는 순간(밥 시간 전 짧은 공복, 산책 직후)을 활용한다. 모방 훈련은 보호자가 직접 시범해 유대로 동기를 끌어올린다. |
| 세션 후반에 집중이 흐트러진다 | 세션이 길어 포화·피로에 빠졌다. 각성이 누적되면 탐색이 거칠어진다. | 짧게(수십 초~수 분) 끊고 높은 강화율을 유지해 '계속 이기고 있다'는 느낌을 둔다. nosework·LAT은 회복 다운타임을 사이에 넣는다. |
| 한 장소·한 자극에서만 되고 새 맥락에서 무너진다 | 일반화 단계를 건너뛰었거나, 규칙이 아니라 특정 행동 목록만 학습했다. | 수식어·모방은 3~5개 행동으로 충분히 다양화한 뒤 전이를 시도한다. 노즈워크·라벨은 환경·사물을 점진적으로 넓혀 같은 규칙을 다른 맥락에서 반복한다. |
강화 밀도는 보통 30초당 클릭 수로 가늠한다 — 새 행동을 빚는 단계에서는 이 수가 높아야 개가 ‘계속 이기고 있다’고 느낀다. 기준을 한 번에 여러 단계 건너뛰는 것 (lumping)이 시도를 끊는 대표 원인이고, 해법은 단계를 잘게 쪼개는 것(splitting)이다. 난도 조절 변수는 프레임워크마다 다르다 — 노즈워크는 거리, Look At That은 자극까지의 거리·지속·강도, 협력적 케어는 처치 강도다. 트리트를 거부하거나 자극에 고착하는 것은 역치를 넘었다는 신호이고, 이때 유일한 목표는 난도를 낮춰 다시 학습 가능한 상태로 돌리는 것이다.
11. 출처
본문에서 쓴 수치·판정의 1차 출처를 프레임워크별로 모았다. 모두 2026-06-05 기준 접속 확인. 핵심 인지 주장 다수가 소표본(N=8~38) 또는 단일 개체(Chaser·Rico) 연구에 기대고, start-button·Look At That은 프로토콜 자체의 무작위 대조 검증이 빈약해 일반 원리에서 연역된 추정이 섞여 있다는 점을 본문에 함께 적었다.
스스로 행동을 만들어내는 훈련 (free shaping · errorless)
- Pryor, Haag & O'Reilly (1969), The creative porpoise — JEAB 12:653–661
- Pryor & Chase (2014), Training for variable and innovative behavior — Int J Comp Psychol 27(2)
- The click is not the trick (PeerJ 2021) — clicker vs 음성 vs 먹이단독
- 부분 강화와 비관적 정서 편향 (PMC7829239)
- Terrace (1963), Discrimination learning with and without errors — JEAB 6:1–27
- Jones et al. (2010), Trial-and-error vs errorless in transfer
보고 따라 하는 훈련 (Do As I Do)
- Fugazza & Miklósi (2014), Deferred imitation & declarative memory — Animal Cognition 17:237–247
- Fugazza et al. (2020), Mental representation & episodic-like memory of own actions — Sci Reports (PMC7320188)
- Fugazza & Miklósi (2015), Do as I do vs shaping/clicker — Appl Anim Behav Sci 171:146–151
- Selective overimitation in dogs (Learning & Behavior 2020)
규칙·개념을 가르치는 훈련 (concept training)
말을 알아듣고 표현하기 (word labels · AAC buttons)
- Pilley & Reid (2011), Chaser — Behavioural Processes 86:184–195
- Kaminski, Call & Fischer (2004), Rico fast mapping — Science 304:1682–1683
- Fugazza et al. (2021), Rapid learning of object names — Sci Reports (PMC7838202)
- Dror et al. (2021), Gifted Word Learner / Genius Dog Challenge — R Soc Open Sci (PMC8493188)
- Bastos, Rossano et al. (2024), Soundboard 단어 이해 — PLOS ONE 19(8):e0307189
- Soundboard 두 버튼 조합 (2024, PMC11628621)
코로 스스로 푸는 훈련 (nosework)
결정권을 주는 훈련 (agency · start-button)
사람과의 대화로 바꾸기 (Look At That)
인지 토대 (canine cognition science)
- Hare et al. (2002), Domestication of social cognition in dogs — Science 298:1634–1636
- Miklósi et al. (2000), 'showing' behaviour in the dog — Animal Cognition 3:159–166
- Udell et al. (2010), What did domestication do to dogs? — Biological Reviews (비판 학파)
- Collier-Baker et al. (2004), invisible displacement 비판 — J Comp Psychol 118:421–433