Trong điều tra thực nghiệm, một bộ số liệu có giá trị khoa học
nhất là khi nó hạn chế tối đa sai số số liệu ở tất cả các bước nghiên cứu. Do vậy,
để tránh sai số, các nhà nghiên cứu cần phải nắm rõ những sai số có thể gặp phải
trong quá trình nghiên cứu, giúp công trình khoa học phản ánh thực tế khách
quan nhất, tránh những kết luận chủ quan sai lầm. Các sai số trong điều tra có
các dạng sau đây:
- Sai số trong khâu chuẩn bị điều tra
Ví dụ/diễn giải
|
|
Sai số do khâu xác định đối tượng điều
tra
|
Trong nghiên cứu về tiến độ đền bù giải
phóng mặt bằng, lựa chọn đối tượng “Hội phụ nữ” để thu thập thông tin thay
cho việc lựa chọn “Cán bộ địa chính – người phụ trách chính về công tác GPMB”
là không phù hợp
|
Sai số trong quá trình thiết kế bảng hỏi
|
Bảng hỏi thiết kế sai kĩ thuật, mắc lỗi
câu hỏi không rõ ý, gây hiểu nhiều nghĩa, hoặc câu hỏi ghép. Ví dụ câu hỏi
“Chị đã từng bị chồng đấm đá chưa? Ở đây đấm và đá về bản chất là 2 hành động
khác nhau, một hành vi dùng tay, một hành vi dùng chân.
|
Sai số từ khâu tập huấn điều tra viên
|
Sai số này chủ yếu ở khâu thống nhất
cách hiểu. Chẳng hạn hỏi về độ tuổi, nếu không thống nhất sẽ dẫn đến đáp án
có thể là tuổi dương lịch và cũng có thể là tuổi dương lịch
|
Sai số từ khâu lựa chọn phương án điều
tra
|
Có nhiều phương án thu thập thông tin:
điều tra trực tiếp, điều tra gián tiếp, điều tra tập trung, điều tra từng người…
Nếu điều tra về các vấn đề tế nhị liên quan riêng tư cá nhân mà hỏi tập trung
sẽ ít được thông tin chính xác.
|
- Sai số chọn mẫu
Ví dụ/diễn giải
|
|
Sai số ngẫu nhiên
|
|
. Sai số do lệch về đặc trưng của phân phối mẫu so với tổng |
Khi hỏi về vấn đề cách thức sản xuất
rau quả, nhà nghiên cứu lựa chọn thành viên trong hộ gia đình bất kì ở nông
thôn để phỏng vấn, tuy nhiên ko phải ai ở nông thôn họ cũng làm nông nghiệp,
và điều tra viên vẫn hỏi những người đó dẫn đến thông tin thiếu chính xác.
Sai số ở đây xuất phát từ việc mẫu không đồng nhất
|
. Sai số do thủ tục thu thập thông tin |
Sai số này xuất phát từ việc người thu
thập thông tin thay đổi mẫu phỏng vấn không theo danh sách đã lập. Mẫu thay
thế không đại diện hoặc tập trung nhiều về một tiêu chí nào đó mà không phản
ánh cho tổng thể
|
Sai
số hệ thống
|
|
. Sai số do mẫu lập ra không thích ứng
với với nhiệm vụ nghiên cứu
|
Khi điều tra về đời sống mọi mặt thanh
thiếu niên nông thôn nhưng chỉ hỏi những thanh niên hiện đang có mặt ở nhà ở
nông thôn. Điều này đã bỏ sót bộ phận thanh niên đang di cư, sống trong quân
đội,… Thông tin được cung cấp sẽ không phản ánh hết được thực tế.
|
. Sai số do chọn mẫu tự phát
|
Cách chọn mẫu này dẫn đến việc không
xác định chính được mẫu có đại diện cho tổng thể hay không. Ví dụ nghiên cứu
về thái độ học tập của sinh viên, khi tiến hành điều tra lựa chọn thư viện là
nơi tiếp cận sinh viên và chỉ chọn buổi chiều. Ở đây có thể dẫn đến sai số khi
đa phần sinh viên lên thư viện là người có ý thức học tập và chỉ tiếp cận những
khóa sinh viên không học buổi chiều.
|
. Sai số do chọn mẫu mang tính “thuận
tiện”
|
Xuất phát từ việc thuận tiện cho việc
tiếp cận nghiên cứu nên nhiều khảo sát chỉ chọn những địa bàn đã quen thuộc để
thu thập thông tin.
|
Sự khác nhau trong sai số chọn mẫu
mang tính ngẫu nhiên hay hệ thống được phân biệt, một bên là sai số trong quá
trình khảo sát, cách thức chọn mẫu đúng nhưng quá trình triển khai lại không
thể thực hiện theo quy trình hoặc việc lập mẫu không lường được hết thực tế.
Ngược lại, sai số hệ thống trong chọn mẫu là sai số ngay từ khâu lựa chọn
hình thức khảo sát. Sai số hệ thống có thể dẫn đến cả cuộc điều tra không có
giá trị.
|
- Sai số trong quá trình thu thập thông tin tại địa bàn
Ví dụ/diễn giải
|
|
Sai
số xuất phát từ điều tra viên
|
|
.
Sai số do lỗi ghi chép
|
NTL trả lời phương án “a” nhưng ĐTV điền
“b” vào phiếu hỏi, do vội vàng
|
. Sai số do lỗi cách hiểu
|
NTL trả lời “đã từng bị đánh” trong
câu hỏi bị bạo lực, nhưng ĐTV điền vào phiếu hỏi ở phương án “bị bạo lực tinh
thần” (thực tế phải điền p.án “bị bạo lực thể xác”)
|
. Sai số từ lỗi không theo nguyên tắc
chung
|
Quy định của nghiên cứu là hỏi thứ tự
từ A->B->C, nhưng ĐTV hỏi theo thức tự B->C->A
|
. Sai số từ thái độ nghiên cứu
|
Sau khi nghe NTL trả lời “đã từng ném
điện thoại vì bực tức”, ĐTV tỏ thái độ bằng việc nói “sao ghê thế, thế là
không được”, điều đó làm cho NTL có thể định hướng các câu hỏi về sau
|
. Sai số do tự điền thông tin
|
ĐTV tự điền câu hỏi mà không hỏi NTL
|
Sai
số xuất phát từ người trả lời
|
|
. Sai số do cố ý trả lời sai
|
Thông tin trả lời không đúng thực tế
theo ý thức của NTL do được định hướng để trả lời theo ý kiến của một người
thứ 3, hoặc muốn che dấu sự kiện thực tế…
|
. Sai số do vô ý trả lời sai
|
Do NTL không nhớ chính xác sự kiện xảy
ra, đặc biệt là trong nghiên cứu hồi cứu
|
. Sai số do không muốn trả lời
|
NTL có thể biết hoặc không biết phương
án trả lời nhưng trả lời cho qua hoặc không trả lời
|
- Sai số trong khâu xử lý số liệu điều tra
Ví dụ/diễn giải
|
|
Sai số khâu bổ sung thông tin, hiệu đính dữ liệu |
Sai số này xuất phát từ việc người hiệu
đính không hiểu rõ hoặc nắm bắt chính xác các thông tin thu được từ cuộc khảo
sát, cũng có thể do vội vàng, chẳng hạn khi mã hóa tỉnh, thay vì ghi tỉnh A
thì lại ghi thành tỉnh B, dẫn đến khâu phân tích theo nhóm tỉnh bị sai số
|
Sai số khâu tạo form nhập liệu
|
Trường hợp này xảy ra khi dựng form nhập
liệu trên các phần mềm không tạo được các ràng buộc (file check) để hạn chế
nhập sai, hoặc đã sử dụng phần mềm nhập liệu nhưng hình dung chưa hết các
ràng buộc để gắn vào form nhập. Chẳng hạn, nếu giữ chức vụ lãnh đạo trong tổ
chức Đảng thì phải là Đảng viên
|
Sai số từ khâu tập huấn cán bộ nhập liệu
|
Cũng giống như giai đoạn khảo sát, trước
khi nhập liệu cũng cần phải tập huấn cho cán bộ nhập liệu để thống nhất cách
hiểu, cách mã hóa. Người tập huấn phải là người tạo form mới nắm rõ được số
liệu mã hóa như thế nào để hướng dẫn chính xác cho cán bộ nhập liệu. Nếu 2
người này là khác nhau thì có thể dẫn đến sai số.
|
Sai số quá trình nhập
liệu
|
Đây là sai số xuất phát từ cán bộ nhập
liệu, do nhập ẩu, nhập nhầm, không tuân thủ quy trình nhập được hướng dẫn hoặc
nhớ sai cách mã hóa
|
Sai số đọc liệu
|
Trong quá trình viết báo cáo, người viết
“đọc”/hiểu sai dữ liệu đã được phân tích dẫn đến phân tích sai, dữ liệu không
tin cậy. Chẳng hạn, trong khảo sát có 3 người trả lời về vấn đề Thông qua luật
Tiếp nhận thông tin, 2 trong số đó đồng ý thì không có nghĩa là 66,7% người
trả lời đồng ý việc thông qua luật Tiếp cận thông tin.
|
No comments:
Post a Comment