Bản dịch của Hiếu Tân

THORNDIKE: HỌC THÔNG QUA THỬ VÀ SAI

Edward Thorndike (1874 – 1949) Nhà tâm lí học Mỹ, Thorndike sinh ngày 31 tháng Tám 1874, và là một trong những người tiên phong của cách học tích cực, một lí thuyết đề nghị rằng nên động viên để trẻ em tự học hơn là ỷ vào hướng dẫn của thầy giáo. Không giống như những nhà lý thuyết
khác được bàn đến trong chương này, Thorndike là một thầy giáo, không phải là một nhà khoa học. Ông tin rằng học theo cách thử và sai là hình
thức cơ bản nhất của sự học. Theo Qui luật Hậu quả, các mối liên hệ giữa hành động và hậu quả được củng cố nếu có một sự ban thưởng.
Thorndike tìm ra Hiệu ứng Halo nổi tiếng (1920). Theo lí thuyết này thì
một đứa trẻ chăm chú hơn sẽ được coi như thông minh hơn, thú vị hơn
và tốt hơn một đứa trẻ lơ đãng. 

  Mặc dầu ông chấp nhận các nguyên tắc Phản xạ có đìều kiện cổ điển, Thorndike (1898) tin rằng phần lớn học được là nhờ thông qua thử và sai. Ông tin rằng khi kết quả là tích cực thì một liên hệ (thói quen) được hình thành và hành vi được tôn trọng. Thorndike nghĩ ra một thí nghiệm hộp câu đố để thử các qui luật của học tập. Ông đặt một con mèo đói vào trong một cái hộp cho nhìn thấy một con cá.

  Nhiệm vụ của con mèo là thoát ra khỏi cái hộp và vồ con cá. Mỗi lần con mèo thoát ra, nó quay trở lại cái hộp. Cuối cùng, phép thử và sai bảo đảm cho con mèo thoát được. Sau một thời gian, những đợt thoát trở nên nhanh hơn khi con mèo lập được mối liên hệ giữa những chuyển động của con mồi của nó và mức cửa. Thorndike gọi quá trình bắt đầu bằng những hành động ngẫu nhiên và sau đó trở thành hoàn toàn cố ý là Qui luật về Hậu quả. Ông tin rằng những hành động tạo ra những hậu quả tiêu cực sẽ yếu đi và biến mất, trong khi những hành động tạo ra những kết quả đáng mong muốn thì mạnh lên và được duy trì. Thử và sai rõ ràng đã giải thích được một khía cạnh của hành vi học tập – hãy xem thí dụ sau đây:

    Jay (3 năm 9 tháng tuổi) muốn ăn kẹo mà mẹ nó để trong tủ bánh cao nó không với được. Jay cố kiễng lên nhưng nó vẫn không với tới tủ bánh kẹo. Nó cố trèo lên trên bệ cao nhưng không tài nào lên được. Cuối cùng nó kéo một chiếc ghế đến. Nó trèo lên chiếc ghế rồi leo lên bệ. Cuối cùng, nhoài người ra nó cũng với được đến tủ bánh, nhưng vì cửa mở ra nên nó ngã nhào xuống khi đã gần đạt được mục đích. Jay đã thể hiện một hành vi hướng-tới-đích thông minh. Để lấy được kẹo, nó cố thử nhiều cách nhưng kết quả xấu là ngã và đau đã khiến nó chắc sẽ không còn cố thử lần nữa – ít ra trong tương lai gần.

   Kyle (4 năm 5 tháng tuổi) muốn đi chơi hội chợ qua Ngôi Nhà Có Ma. Bố nó nhắc nó lần trước hai cha con đã đi và Kyle đã sợ phát ốm. Kyle khăng khăng nói rằng hồi đó nó còn bé nhưng bây giờ nó đã lớn rồi, nên không sợ nữa. Cuối cuộc đi, Kyle thét lên và khóc khi trông thấy những con ma. Sau đó, nó nói với mẹ nó rằng chuyến đi rất thích và nó muốn đi nữa. 

  Xét theo cái bản chất phức tạp và ngang ngạnh của con người, thì ý niệm cho rằng những hành vi tạo ra hậu quả xấu luôn luôn yếu đi và biến mất có lẽ là quá đơn giản. Hơn nữa, nếu tất cả các hành vi không thích hợp có thể đảo ngược, thì chả cần đến những bài học hành vi trong nhà trường, các trung tâm giáo dục trẻ hư và các nhà tù làm gì. Tương tự với Pavlov và Watson, Thorndike tập trung nhiều hơn vào việc giải thích các qui luật của học tập hơn là tìm hiểu tư duy, động cơ và ý định tác động đến hành vi như thế nào

SKINNER: HÀNH VI TUỲ THUỘC HẬU QUẢ

B.F. Skinner(1904 – 1990) Nhà tâm lí học người Mỹ Skinner sinh ngày 20
tháng Ba năm 1904 ở Pennsylvania. Có vợ và hai con gái. Những công
trình nghiên cứu của Skinner chịu ảnh hưởng mạnh mẽ của Thorndike.
Ông không nhất trí với chủ trương của thuyết Phản xạ có điều kiện cổ
điển mô tả người học như những người tiếp nhận thụ động các kiến thức. Ông đồng ý với thuyết của Thorndike cho rằng các cá nhân không phải là những người học thụ động mà chủ động, hành vi của họ được định
hướng chủ yếu bằng thưởng và phạt (các hậu quả). Kỹ thuật của ông tiếp tục cung cấp thông tin cho các chương trình hành vi trẻ em (như các bản đồ sao) can thiệp vào các trường hợp trẻ có tính tự kỷ, tật câm có lựa
chọn, và hành vi có vấn đề. 

   Mặc dầu ông không phản đối công trình của Pavlov và Watson, Skinner tin rằng học tập không phải là một quá trình thụ động như thuyết Phản xạ có điều kiện cổ điển mô tả, mà là một quá trình tích cực, chủ động. Trái với Phản xạ có điều kiệncổ điển, thuyết Hành vi tuỳ thuộc hậu quả cho rằng chính người học chứ không phải đồ vật hay vật kích thích tạo ra những thay đổi trong hành vi.

           Định nghĩa

Học tập tuỳ thuộc hậu quả (cũng gọi là tuỳ thuộc công cụ) xảy ra khi hành vi được thưởng hoặc bị phạt. Thông qua tuỳ thuộc hậu quả, một liên kết được thiết lập giữa hành vi và hậu quả

   Hãy xem bé Cody, một cậu bé 3 tuổi, muốn ăn một chiếc bích qui. Thay vì thụ động chờ  người ta cho, Cody bắt đầu hỏi mẹ, và khi không được, nó khóc và dậm chân. Vẫn không được, nó kéo một chiếc ghế đến bên bệ, cố trèo lên mở hộp bánh và lấy ‘phần thưởng’ của nó.

  Skinner tán thành niềm tin của Thorndike rằng những đáp ứng dễ chịu có thể làm mạnh lên hành vi đáp ứng và những đáp ứng khó chịu làm yếu đi và làm mất hành vi. Skinner mô tả quá trình học tập như sau: Trước hết, những củng cố tích cực (như lời khen, nụ cười, cái vỗ nhẹ lên lưng, gắn sao v.v..) củng cố hành vi. Thứ hai, những củng cố tiêu cực (như bắt ngồi vào một góc, ) có thể làm biến mất một số hành vi. 

         Các củng cố tích cực         (Lời khen, dấu hiệu khen)                  →                               làm mạnh hành vi 
         Các củng cố tiêu cực/Phạt                                                      tránh,         (Bắt ngồi một chỗ/đếm thời gian)      →                                 làm yếu hành vi                                                                                                         biến mất

Các củng cố tích cực và tiêu cực

 Một khía cạnh quan trọng khác của công trình của Skinner liên quan đến tần suất của củng cố. Chẳng hạn, nếu một đứa bé được khen mỗi lần nó nói cảm ơn, thì lời khen chẳng mấy chốc mất đi giá trị. Hoạ hoằn mới khen thì đứa trẻ cảm thấy bị đánh giá thấp và thôi không cám ơn nữa. Trong cả hai trường hợp, hành vi yếu đi theo thời gian và biến mất. Những phát hiện từ những thí nghiệm của ông với động vật dẫn Skinner tới bốn loại sơ đồ củng cố. Được mô tả trong bảng 3.1 dưới đây, dùng câu “xin làm ơn”(please) làm ví dụ, có thể thấy rằng một khi hành vi được thiết lập, tưởng thưởng được ban theo một sơ đồ cách quãng và thay đổi có hiệu quả cao nhất. Trong khi củng cố liên tục có thể dùng ở đầu quá trình, củng cố cách quãng và thay đổi có vẻ có tác dụng lâu dài lên hành vi.

Bảng 3.1 Sơ đồ củng cố và những kết quả dễ xảy ra

________________________________________________________________________

Củng cố                            Mẫu quãng lời khen                                    Mức độ lặp lại

________________________________________________________________________________________________________________________________________________

1.Liên tục                   Khen mỗi lần trẻ nói ‘làm ơn’ (please)                   Thấp/vừa

2. Tỉ lệ cố định           Khen cố định ở lần thứ 4 và thứ 6                           Thấp/vừa

3.Quãng cố định         Khen khi nói ‘làm ơn’ trong một khoảng

                                    thời gian cố định, vd 10 phút                                    Thấp/vừa

4. Từng đợt/                Khen không theo mẫu nào cả, vd, lần thứ 

  thay đổi                     3, thứ 8, thứ 11.                                                       Vừa/ cao

_______________________________________________________________________________________________________________________________________________

  Lori (3 năm 2 tháng tuổi) mới có em bé. Nó không thích em lắm và thích búp bê hơn. Từ khi có em bé, Lori hay bực bội và giận dỗi. Lo rằng Lori cảm thấy bị bỏ rơi, mẹ của nó yêu cầu nó giúp tắm cho em bé. Lori tỏ ra vui mừng và thích thú xếp tã lót, khăn, túi em bé và bàn chải cho em. Mẹ nó nói đi nói lại rằng Lori là một cô bé ngoan và là người giúp việc giỏi giang cho mẹ như thế nên mẹ làm cho nó món bánh ngọt mà nó thích. Công việc cứ lặp lại như thế hằng ngày cho đến ngày thứ tư thì Lori nằm lăn ra sàn và gào lên rằng nó không muốn làm người giúp việc. Lời khen liên tục đã mất ý nghĩa và mẹ nó phải nghĩ ra cách khác nếu bà muốn cải thiện hành vi của Lori.

  Trong những năm 1950, Skinner tiến một bước xa hơn trong nghiên cứu bằng cách áp dụng nguyên tắctuỳ thuộc hậu quảcho học tập có máy tính trợ giúp (CAL). Sử dụng một chương trình học trọn gói đơn giản, ông thưởng cho mỗi câu trả lời đúng, chẳng hạn một ngôi sao hay chữ “giỏi” hiện trên màn hình, trong khi câu trả lời sai nhận được “cố lần nữa”. Mặc dầu CAL không nhận được ủng hộ trong những năm 1950, vào những năm 1990 một số phương pháp điều trị đã áp dụng nguyên tắc tuỳ thuộc hậu quả, trong số đó có những trẻ em cá biệt – trẻ em không thích đến trường (Davies , 2008) và trẻ mắc chứng tự kỷ (Silver và Oakes, 2001).

   Các cách tiếp cận được áp dụng rộng rãi gồm có hệ thống dấu hiệu[1](token economy) và Phân tích Hành vi Ứng dụng (ABA). Nhiều trường sử dụng một sơ đồ khuyến khích dưới dạng những dấu hiệu để thưởng cho những học sinh đến lớp đầy đủ, giữ đúng giờ, gọn gàng sạch sẽ và hoàn thành tốt công việc. Học sinh có thể đổi những dấu hiệu lấy phần thưởng như vé xem phim. Khi hành vi của học sinh được cải thiện, các dấu hiệu dần dần được thay bằng lời khen và cuối cùng là những điểm tốt. Hệ thống dấu hiệu do Ayllon và Azrin nghĩ ra năm 1968, họ dùng những dấu hiệu để củng cố hành vi thích hợp trong số 84 bệnh nhân dài hạn của một bệnh viện tâm thần. Các dấu hiệu được đổi lấy phiếu ăn, để mua hàng và làm giấy phép ra khỏi bệnh viện. Để bảo đảm bệnh nhân hiểu rõ sự mong đợi của nhân viên bệnh viện đối với họ, người ta giải thích cho bệnh nhân không nhận được dấu hiệu, chẳng hạn “anh hôm nay không được dấu hiệu vì anh để đầu bù tóc rối quá” (Gross, 1996, tr 832). Mặc dù chương trình này khá thành công, việc sử dụng hệ thống dấu hiệu không tăng mấy trong các bệnh viện tâm thần.

   Tương tự, ABA được Lovaas nghĩ ra năm 1987 nhằm củng cố một cách hệ thống những dạng hành vi thích hợp trong trẻ em tự kỉ. Chương trình này yêu cầu dạy các kĩ năng ngôn ngữ, nhận thức, xã hội, và tự trong mọi môi trường và chia những kĩ năng này thành những nhiệm vụ nhỏ, mỗi nhiệm vụ được dạy theo một cách thức có tổ chức cao và có trật tự thứ bậc. Có sự tập trung vào ban thưởng, hay củng cố, những hành vi đáng mong muốn và không nhìn nhận, hay làm chuyển hướng, hoặc làm nản lòng những hành vi không thích hợp. Lovaas khuyên nên đưa các bé tự kỉ đến chương trình ABA khi chúng được 5 tuổi. Ngoài ra, ông nghĩ ra một phiên bản cải tiến của ABA dưới dạng liệu pháp vui chơi cho trẻ em từ 3 tuổi trở xuống. Theo Keenan, Kerr và Dillenburger (2000), ABA đã tỏ ra đặc biệt có hiệu quả trong điều trị trẻ nhỏ tự kỉ và đã giúp làm giảm những hành vi thu mình gò bó và đập phá trước khi chúng trở nên cố định.

   Các chiến dịch quảng cáo cũng lợi dụng lí thuyết học liên kết (tuỳ thuộc). Chẳng hạn, trong những quảng cáo trên truyền hình, hiếm khi người ta trưng hình sôcôla lên mà không chiếu cảnh một cô gái trẻ hấp dẫn đang ăn nó trong một tư thế thoải mái. Cảnh này chiếu đi chiếu lại nhiều lần làm cho khán giả đâm ra xuất hiện một liên kết giữa nhãn hiệu sản phẩm và sự thoải mái. Liên kết này có thể tổng quát hoá ra đến mức độ tất cả các dạng sôcôla liên kết với sự thoải mái. Các chiến dịch tiếp thị khác cũng nhằm đến những liên kết khác nhau. Chẳng hạn trong một quảng cáo sản phẩm như kem đánh răng, nhân vật trung tâm thường xuyên hiện ra trong chiếc áo choàng trắng của phòng thí nghiệm. Điều này gợi ý cho khán giả rằng sản phẩm đã được sự ủng hộ của các chuyên gia trong lĩnh vực này. Nhiều phong cách sống được tạo ra với những nhân vật được mô tả đẹp đẽ, và cứ theo như quảng cáo thì nếu bạn dùng một loại bắp đóng hộp nào đó con bạn sẽ ăn ngấu nghiến và nó lớn nhanh như thổi và trở nên khoẻ mạnh.


[1]Như ngôi sao, bông hoa, “phiếu bé ngoan” v.v..