ANITA E. WOOLFOLK

Bản dịch của TLHGD

ĐIỀU KIỆN HOÁ DO TÁC ĐỘNG (OPERANT CONDITIONING)

Kỳ trước, ta nói về việc học tương đối mang tính tự động về cảm xúc (lo sợ, thư gĩan…) Nhưng cũng có những người học hoàn toàn tích cực tham dự vào tiến trình học. Họ luôn hành động một cách quyết ý, họ “tác động” vào môi trường. Điều kiện hoá do tác động là tiến trình học mang tính hành vi liên quan đến những hành động quyết ý nói trên. 

Công trình của Thorndike và Skinner

Cả hai ông đóng vai trò hàng đầu trong việc phát triển kiến thức mà ngày nay ta gọi là điều kiện hoá do tác động. Edward Thorndike (1913) thoạt tiên làm việc với lũ mèo đặt trong các hộp thử thách. Để ra khỏi hộp và lấy được thức ăn bên ngoài, mèo phải kéo một cái chốt hay thực hiện một nhiệm vụ khác. Chúng phải tác động vào môi trường. Sau những động tác điên rồ xảy ra khi cái hộp bị đóng lại, cuối cùng lũ mèo cũng làm đúng động tác để thoát khỏi hộp, thường là do tình cờ. Sau khi lặp lại tiến trình nhiều lần, mèo học được cách đáp ứng đúng gần như tức thời. Từ đó Thorndike rút ra một qui luật quan trọng của việc học là luật hiệu quả: bất kỳ hành động nào sinh ra một hiệu quả thoả mãn trong một tình huống nhất định sẽ có xu hướng được lặp lại trong tình huống ấy. Vì việc kéo một cái chốt sinh ra sự thoả mãn (lấy được thức ăn), động tác này đã được lặp lại khi mèo thấy mình bị đặt lại trong hộp.

Từ đó Thorndike thiết lập cơ sở cho việc điều kiện hoá có tác động, nhưng người thường được coi là phát triển khái niệm ấy lại là B.F. Skinner (1953). Skinner bắt đầu với niềm tin rằng các nguyên lý của việc điều kiện hoá kinh điển chỉ chiếm một tỷ lệ nhỏ trong các hành vi học được. Điều kiện hoá kinh điển mô tả những hành vi hiện hữu có thể liên kết với kích thích mới như thế nào nhưng không mô tả những hành vi mới được thu nhận như thế nào. Nhiều hành vi không phải là đáp ứng đơn giản với kích thích, mà là những hành động quyết ý hay có tác động. Theo Skinner, những sự tác động ấy chịu ảnh hưởng bởi những gì xảy ra sau đó. Vì vậy, điều kiện hoá có tác động hay việc học có tác động liên quan đến việc kiểm soát các hậu quả của hành vi.

Để nghiên cứu các hiệu quả hay hậu quả đối với hành vi trong những điều kiện được kiểm soát cẩn thận, Skinner nghĩ ra một dụng cụ đặc biệt giống như cái lồng. Chủ thể của các nghiên cứu của Skinner thường là chuột hay chim bồ câu đặt trong các lồng, được gọi là hộp Skinner. 

… Ta có thể hình dung một cái hộp như thế có thể được dùng để nghiên cứu hiệu ứng của hậu quả tích cực (thức ăn) hay hậu quả khó chịu (sốc). Một con chim bồ câu đói được đặt trong cái hộp và tiến hành thăm dò nó. Nó đi quanh và cuối cùng mổ vào cái đĩa, lúc đó một viên thức ăn rơi xuống khay thức ăn. Con chim ăn viên thức ăn, đi quanh hộp, và sớm mổ lại vào đĩa. Lại có thêm thức ăn… Lần sau, được đặt vào hộp, con chim sẽ đi thẳng đến cái đĩa và bắt đầu mổ.

Sử dụng cách ấy, Skinner đã có thể nghiên cứu nhiều câu hỏi về hiệu ứng của các hậu quả đối với hành vi. 

Kiến thức sơ đẳng về Điều kiện hoá có tác động

Hành vi, giống như đáp ứng hay hành động, chỉ đơn giản là một từ để chỉ việc người ta làm trong một tình huống cụ thể. Về mặt khái niệm, ta có thể nghĩ hành vi là kẹp giữa hai cụm ảnh hưởng của môi trường: cụm đi trước (tiền đề) và cụm đi sau (hậu quả). Quan hệ này có thể được biểu hiện như sau: tiền đề -> hành vi -> hậu quả hay A -> B -> C.

Do đó, hành vi có thể thay đổi bởi một thay đổi ở tiền đề, hậu quả, hay cả hai. Theo quan điểm hành vi luận, các hậu quả xác định phần lớn việc con người (hay vật) sẽ lặp lại một hành động trong tương lai.

Kiểm soát hậu quả

Các hậu quả sinh ra bởi một hành vi cụ thể có thể là dễ chịu hay khó chịu. Thời gian diễn ra hậu quả cũng có hiệu ứng với chủ thể.

  • Củng cố: 

Hiệu ứng của hậu quả xác định tính củng cố của nó. Hậu quả là nhân tố củng cố nếu như nó tăng cường hành vi mà nó đi theo. Nếu thấy một hành vi luôn lặp lại hay tăng cường, ta có thể cho rằng có nhân tố nào đó củng cố nó.

Có hai kiểu củng cố. Một  là củng cố tích cực, xảy ra khi một kích thích (thường dễ chịu) theo sau một hành vi (TD: sự tưởng thưởng). Lưu ý rằng sự củng cố tích cực có thể vẫn xảy ra khi hành vi không “tích cực” theo cách nhìn của GV (TD: em HS trả lời “Clark Gable” liên kết với “miền Nam” nhận được sự chú ý và tiếng cười của lớp). Không ít sự củng cố như thế vô tình xảy ra trong lớp.

Hai là củng cố tiêu cực, đó là sự bỏ đi hay tránh một kích thích khó chịu. Nếu một hành động cụ thể cho phép ta tránh hay thoát khỏi một việc khó chịu, ta dễ lặp lại hành động ấy khi lại đối diện với một tình huống tương tự. TD: nếu HS bị thường xuyên đưa lên văn phòng khi vi phạm kỷ luật trong lớp, các em có thể tiếp tục phạm kỷ luật, nếu như việc ấy giúp các em thoát khỏi những tình huống “xấu” như bài kiểm tra hay giờ học chán ngắt. Như thế, hành vi xấu lại được duy trì qua sự củng cố tiêu cực.

  • Trừng phạt: 

Sự củng cố tiêu cực thường bị lẫn với trừng phạt. Tiến trình củng cố (tích cực hay tiêu cực) luôn dính líu đến tăng cường hành vi. Trong khi trừng phạt lại là giảm bớt hay đàn áp hành vi. Một hành vi kéo theo sự trừng phạt khó được lặp lại trong những tình huống tương tự trong tương lai. Lại nữa, hiệu ứng sẽ xác định một hậu quả có phải là trừng phạt hay không. TD: một GV muốn khen thưởng một HS làm bài tốt bằng cách đọc bài làm của em trước lớp, có thể có hậu quả là em HS e thẹn sẽ coi đó là sự trừng phạt.

Giống như sự củng cố, sự trừng phạt có thể có hai hình thức, tích cực hay tiêu cực. 

Các lịch trình củng cố

Khi người ta học một hành vi mới, việc học sẽ nhanh hơn nếu mỗi đáp án đúng đều được củng cố. Đó là lịch trình củng cố liên tục. Tuy nhiên, một khi đáp án đã thành thạo, thì lại nên củng cố theo lịch trình gián đoạn – tức là thường xuyên nhưng không phải lần nào cũng củng cố. Có nhiều lý do cho việc sử dụng lịch trình củng cố gián đoạn để duy trì các kỹ năng đã được thiết lập. Một lý do giản dị là việc củng cố mỗi đáp án đúng (liên tục) là mất thời gian và GV không thể làm nổi trong lớp. Lý do khác là sự củng cố gián đoạn giúp HS tập không trông đợi nó mỗi lần.

Có 4 kiểu căn bản của lịch trình củng cố gián đoạn. Hai kiểu dựa trên thời lượng giữa hai lần củng cố, được gọi là lịch trình cách quãng (interval schedules). Hai kiểu kia dựa vào số lượng đáp án có giữa những lần củng cố, gọi là lịch trình tỷ số (ratio schedules). 

Bảng so sánh các lịch trình củng cố

  1. Cách quãng cố định:      -Định nghĩa:   Củng cố khả đoán, dựa trên những khoảng cách thời gian cố định                     – Ví dụ: Củng cố đáp án đúng đầu tiên sau mỗi 5 phút. – Mẫu đáp ánTỷ suất đáp ứng tăng khi gần đến lúc củng cố; ngưng lại sau khi củng cố
  2. Cách quãng biến đổi: – Định nghĩa: Củng cố bất khả đoán, dựa trên các khoảng cách thời gian biến đổi. – Ví dụ: Củng cố đáp án đúng sau 5 phút, rồi 7 phút, 3 phút, 9 phút. – Mẫu đáp án: Tỷ suất đáp ứng chậm, vững chắc; ngưng rất ngắn sau khi củng cố
  3. Tỷ số cố định: – Định nghĩa: củng cố khả đoán, dựa trên số lượng đáp án. – Ví dụ: củng cố sau mỗi 10 đáp án đúng. – Mẫu đáp án: Tỷ số đáp ứng cao; ngưng sau mỗi củng cố
  4. Tỷ số biến đổi: – Định nghĩa: Củng cố bất khả đoán, dựa trên số lượng biến đổi các đáp án. – Ví dụ: củng cố đáp án đúng thứ 10, rồi thứ 7, thứ 9, thứ 12. – Mẫu đáp án: Tỷ số đáp ứng rất cao; ngưng ngắn sau củng cố

Các mẫu đáp ứng

Khi sự củng cố dựa trên chuẩn Cách quãng cố định thì phần thưởng là khả đoán. Vì sự củng cố là khả đoán, nên đáp án sẽ tăng lên khi đến gần thời gian củng cố được trông đợi và ngưng lại sau khi đã được củng cố. TD: nếu HS biết rằng GV sẽ ghé thư viện mỗi 15 phút để khen những em chăm đọc sách, thì mặc dù không HS nào có đồng hồ, vẫn xảy ra việc sau 12 phút là tất cả HS bắt đầu chăm chú đọc sách, rồi ngay sau khi GV khen và bỏ đi, HS sẽ có thể thư giãn, giải lao… vì biết rằng cơ may của sự củng cố (hay trừng phạt) sẽ không xảy ra trong nhiều phút tới…

Khi sự củng cố dựa trên chuẩn Cách quãng biến đổi, ví dụ GV trở lại bất ngờ sau 45 giây, thì thời gian ngưng nghỉ của HS sẽ ít hơn… Những GV muốn HS học nghiêm túc sẽ ưa thích kiểu củng cố này.

Nguyên tắc trên cũng đúng cho chuẩn Tỷ số cố định Tỷ số biến đổi. Nếu HS biết GV chỉ chú ý đến các bài làm đã hoàn tất (tỷ số cố định), HS có thể nghỉ dài hơi sau mỗi bài làm trước khi bắt tay làm bài mới. Tuy nhiên, nếu GV đòi hỏi kết quả làm việc từng phần sau thời gian bất định, và chấm điểm cho sự tiến bộ (tỷ số biến đổi), thì HS sẽ làm việc dần dà mỗi ngày. Các GV muốn HS làm việc thường xuyên trong 2 tuần cho mỗi dự án hơn là trong 2 ngày, sẽ ưa lịch trình sau. 

Tốc độ thực hiện

Các lịch trình củng cố khác nhau cũng có thể có hiệu ứng đối với tốc độ thực hiện của HS. Nếu dựa trên số lượng đáp án – tỷ số hơn là cách quãng – thì HS sẽ kiểm soát thời gian củng cố tốt hơn. TD: nếu GV nói “em nào giải đúng 10 bài toán sẽ được ra chơi”, HS sẽ làm bài nhanh hơn so với khi GV nói “hãy giải 10 bài toán trong 20 phút, rồi tôi sẽ kiểm tra và các em làm đúng 10 bài sẽ được ra chơi”.

Bền bỉ

Là khía cạnh hiệu ứng thứ ba của lịch trình củng cố. Nếu sự củng cố hoàn toàn bị rút bỏ, HS dễ giảm tốc độ và cuối cùng ngưng đáp ứng. Nói cách khác, hành vi có thể bị huỷ. Tỷ số huỷ bỏ sẽ phụ thuộc phần lớn vào lịch trình củng cố.

Nếu sự củng cố là liên tục, HS sẽ ngưng đáp ứng khi GV ngưng củng cố. Những lịch trình cố định (về cách quãng hay tỷ số) cũng dẫn đến sự huỷ tương đối nhanh. Để khuyến khích sự đáp ứng bền bỉ, các lịch trình biến đổi là thích đáng hơn. 

Kiểm soát các tiền đề

Các tiền đề cho ta thông tin về việc những hành vi nào là thích đáng trong một tình huống nhất định – tức là, những hành vi nào sẽ dẫn tới các hậu quả tích cực hay tiêu cực. Thường trong đó có một loại ám hiệu tiền đề (antecedent cue). Ta thường đáp ứng những ám hiệu này mà không biết được là chúng đang ảnh hưởng đến hành vi của mình. Nhưng ám hiệu có thể được dùng một cách chủ ý trong việc dạy học.

Theo định nghĩa, ra ám hiệu (cueing) là hành động đưa ra một kích thích tiền đề ngay trước khi một hành vi cụ thể diễn ra. Nó đặc biệt hữu dụng trong việc dọn sàn cho các hành vi phải diễn ra ở một thời điểm đặc thù nhưng dễ bị quên. Khi làm việc với các em nhỏ, GV (và phụ huynh) thường có việc sửa chữa các hành vi sau khi chúng xảy ra. TD: có thể nhắc HS “lần sau các em nhớ…”. Những lời nhắc ấy thường làm cho HS khó chịu, thậm chí phản ứng.

Ám hiệu không phán xét có thể giúp tránh những sự đối đầu tiêu cực như thế. Khi HS có một hành vi thích đáng sau một ám hiệu, GV có thể củng cố thành tích của HS thay vì trừng phạt sai lầm của em.

Trong buổi học của cô Elizabeth ở phần trên, việc ra ám hiệu có thể có tác dụng. Khi vào lớp, cô có thể nói: “Bây giờ ta chơi một trò chơi, đôi khi khó cưỡng được việc đưa ra những nhận xét ngớ ngẩn. Các em có thể giúp đỡ bạn mình bằng cách không cười khi ai đó đưa ra một nhận xét mang tính đùa cợt”. Và sau khi có những nhận xét nghiêm túc đầu tiên, cô có thể nói: “Chúng ta đã làm việc tốt, đúng vào chủ đề. Giờ đây ta có thể vui chơi thêm ít phút nữa trước khi vào bài học…”