Followers

Saturday, July 13, 2013

සංඛ්‍යානයේ මූලික සංකල්ප 01













අපි මුලින්ම බලමු සංඛ්‍යානය කියන්නෙ මොකක්ද කියලා.............

සංඛ්‍යානය කියන්නෙ Survey එකකින් හෝ Experiment එකකින්,
  1. දත්ත එක් රැස් කරලා (Data Collection)
  2. ඒ ගත්තු data පිළිවෙලකට සකස් සංවිධානය කරලා (Organizing)
  3. පිළිවෙලකට සකස් කර ගත්තු data ටික විශ්ලේෂණය කරලා (Analyzing) 
  4. අන්තිමට එම data මගින් ලබාගත් Information කාට කාටත් තේරුම් ගන්න පුළුවන් විදිහටඉදිරිපත් කිරීම (Interpretation)


මොනවද මේ DATA??? මොනවද මේ INFORMATION?????

දත්ත කියන්නෙ අපි  Survey එකකින් හෝ Experiment එකකින් ලබා ගන්නා නිරීක්ෂණයන් (Observations).

අපි ඒ විදිහට ගන්න data පිළිවෙලකට සකස් කරල නෑ. Data කියන ජාතිය තියෙන්නේ අමුවෙම. ඒ අපි ගත්තු data ටික පිළිවෙලකට මොකක් හරි තෙරුමක් ඇති විදිහකට සැකසුවා ම අපිට ඒ අමුවෙන් තිබුණ data වලින් මොකක් හරි තෙරුමක් ගන්න පුළුවන්. අන්න ඒ විදිහට සකස් කරපු data වලට අපි කියනවා Information කියලා. ඔන්න ඕකයි Data සහ Information අතර වෙනස.

අපි දැන් මේ ගන්න data අපි බෙදනවා මෙන්න මේ විදිහට...
Method of Data Collection:

Primary Data

Primary Data කියන්නෙ අපි මොකක් හරි දේකට (හිතමුකො අපේ research එකකට කියලා) අපිට අවශ්‍ය කරන data කෙලින්ම අපි Questionnaire එකකින් මිනිස්සුන් ගෙන් ප්‍රශ්න අහලා හරි ෆීල්ඩ් එකේ මොකක් හරි experiment එකක් කරල හරි (ඒ කිව්වේ පැළ වවාගෙන කරන එකක් වගේ දෙයක්, නැත්නම් ලැබ් එකක bacteria count කරනවා වගේ දෙයක්) උණු උණුවේ අපිට ඕන data ටික කෙලින්ම අදාල පුද්ගලයගෙන් හරි අදාල ෆීල්ඩ් එකෙන් ගන්නවා නම් ඒ ජාතියේ data වලට අපි කියනවා primary data කියලා


Secondary Data

Secondary Data කියන්නේ කිසියම් කෙනෙක් එකතු කරපු primary data වලට. අපි මෙහෙම හිතමුකො, Dept of Census and Statistics එකෙන් එකතු කරනවා ලංකාවෙ මිනිස්සුන්ගෙ ආදායම් ගැන විස්තර (ඒ කියන්නේ primary data). ඊට පස්සේ ඒවා එයාලා publishකරනවා වෙබ් එකේ. අපි අන්න ඒ වෙබ් එකේ දාපු data ගන්නව නම් අපි ඒ ගත්තු data වලට කියනවා "Secondary Data" කියලා. මොකද ඒවා අපි විසින් එකතු කරපුවා නෙමෙයි. වෙනත් කෙනෙක් එකතු කරපු දෙයක් කොහෙන් හරි ගත්තු එකයි අපි එතනදි කරන්නෙ.


Scale of Measurement:

Nominal Data:

Data බෙදන අනිත් ක්‍රමය තමයි Scale of Measurement අනුව. ඒ කියන්නේ data මනින විදිහ අනුව. මුල්ම එක තමයි "Nominal Data". මෙන්න මේ nominal data තමයි data වර්ග වලින් දුර්වලම මිනුම. එහෙම කිව්වට තෙරෙන්නෙ නෑ නේද?? මෙන්න මේකයි ඒකෙ තෙරුම...
නොමිනල් කියන්නෙ "නම". එහෙමත් නැත්නම් "හඳුනාගැනීම" කියන එක. Nominal data වලින් කරන්නෙ අපේ sample එකේ තියන objects හඳුනා ගැනීමක් පමණයි. උදාහරණයක් කිවොත් හොඳටම තේරේවි මං හිතන්නෙ.

හිතන්නකො අපි research එකකට ගත්තු data  සෙට් එකක ඉන්න මිනිස්සුන්ව අපි බෙදනවා smokers සහ non-smokers විදිහට. එහෙම බෙදලා අපි smokersලට "1" කියන symbol එක දෙනවා. non-smokersලට "0" කියන symbol එක දෙනවා. අපි එතනදි කළේ data set එකෙ හිටපු මිනිසුන්ව categories දෙකකට බෙදුවා හඳුනා ගන්න. තව උදාහරණයක් ගත්තොත් අපේ data set එකක ඉන්න මිනිසුන්ව අපි gender එක අනුව බෙදුවොත් පිරිමි අයට "1" කියලා දෙන්න පුලුවන්. ගෑණු අයට "0" කියලා දෙන්න පුලුවන්.ඒකෙදිත් අපි කළේ හඳුනා ගන්නට නමක් දුන්න එක විතරයි. ඉතින් මේකෙදි කරන්නේ data set එකෙ තියන objects හඳුනා ගන්නට ඒවා අපි categorize කරල නමක් දෙනවා. මේ data වලින් හඳුන ගන්නවාට වඩා දෙයක් කරන්න බැහැ. ඒකයි මේ nominal data දුර්වලම මිනුම කියන්නෙ. මේකෙදි අපි objects ටික categorize කරන නිසා මේ data ජාතියට "Categorical Data" කියලත් කියනවා.



Nominal Data වලට තව උදාහරණ තමයි, Gender, Blood groups, Ethnicity etc.

Ordinal Data:

මීළඟ data වර්ගය තමයි "Ordinal Data". මෙන්න මේ ordinal data වල ලක්ෂණය තමයි, මේ data වල තේරු  (meaning ) එක තියෙන්නේ data වල තියන "Order" එක අනුව. තේරුනේ නෑ නේද?? ගණන් ගන්න එපා. හරිම ලේසියි. මං උදාහරණයක් කියන්නම්.....

අපි ගමුකො හමුදාවෙ rankings. ඒකෙදි අඩුම rank එක තමයි soldier . ඊට වඩා ලොකුයි කෝප්‍රල්. ඊටත් වඩා ලොකුයි බ්‍රිගේඩියර්. දැන් තෙරෙනවා නේද?? මේ data වල order එකක් තියනවා. අඩුම එකේ ඉඳන් වැඩිම එකට යන පිළිවෙලක් තියනවා මේ data වල. ඉතින් මේ data වල තේරු තියෙන්නෙ මේ order එකේ. 



තව උදාහරණයක් කිවොත් අපි මොකක් හරි පැණි බීම ජාති 5ක් අරගෙන ඒක බොන්න දෙනවා මිනිස්සු 50 දෙනෙක්ට. ඊට පස්සෙ අපි ඒ මිනිස්සුන්ට කියනවා ඒ බීම ජාති 5 ට තියන කැමැත්ත ලියන්න කියලා 1 සිට 5 වෙනකල් ඉලක්කම් වලින්. එතන්දි අපි එයාලට කියනවා 1 කියන්නේ අඩුම කැමැත්ත, 5 කියන්නේ වැඩිම කැමැත්ත කියලා. ඊට පස්සෙ අපිට පුලුවන් බලා ගන්න මිනිස්සුන්ගෙ කැමැත්ත වැඩි වෙන්නෙ මොන බීම ජාතියෙ ඉඳන් මොන එකටද කියලා. එතකොට කැමැත්ත (preference) කියන්නෙ ordinal data එකක්. 




Interval Data:

තුන්වෙනි වර්ගෙ තමයි "Interval Data". මෙන්න මේ interval data වල meaning එක තියෙන්නෙ එම ජාතියෙ data දෙකක් අතර තියන ඉඩව්වේ. ඒ කියන්නෙ interval එකේ. ඒවගේම තමයි මේ data වල තියන වැදගත්ම ලක්ෂණේ තමයි interval data වලට "true zero" එකක් නෑ. 

true zero ???? ඒ මොකක්ද???


ලොකු දෙයක් නෙමෙයි.. මෙන්න මේකයි.. zero කියන්නෙ මොකක්ද?? බින්දුව නේ... හරි.. "0" කියන එකේ තෙරුම එතන කිසි දෙයක් නෑ කියන එකනෙ.  ඉතින් ඒක ඇත්තම ඇත්ත බින්දුවක් නම් එතන කිසි දෙයක් තියෙන්න බෑ. එතකොට දැන් බොරු බින්දුත් තියනවද?? ඔව්... ඒකනේ මේ කියන්න යන්නේ.. සමහර බින්දු තියනවා එවයෙ අගය "0" උනාට එතන යමක් තියනවා... ම්ම්ම්ම්ම්ම්ම්..... Interval data අන්න එහෙමයි.

හොඳම උදාහරණේ තමයි temperature එක. temperature එකෙ තියෙන්නෙ බොරු බින්දුවක්. හිතන්න.. සෙල්සියස් 0 කියන එකේ තෙරුම, එතන temperature එකක් නෑ කියන එකද?? නැහැ නේද?? සෙල්සියස් 0 කියන්නෙත් යම් උෂ්ණත්වයක්. එතකොට ඒ true zero එකක් නෙමෙයි. මං කලින් කිව්වනේ මේවයෙ interval එකෙයි තෙරුම තියෙන්නෙ කියලා. ඒක වෙන්නේ මෙහෙමයි. අපි උෂ්ණත්වය මනින මිනුම අනුව උෂ්ණත්ව දෙකක වෙනසේ ratio එක ගත්තොත් ඒ ratio දෙකම සමානයි. ඒ කියන්නේ අපි temperature මනින්නෙ සෙල්සියස් වලින්ද ෆැරන්හයිට් වලින්ද කියන එක මත නෙමයි ඒ ratio එක depend වෙන්න. ඒක depend වෙන්නෙ interval එක මත.



උදා:

සෙල්සියස්  =>  (30 - 10)/ (10 - 0 ) = 2
ෆැරන්හයිට් =>  (86 -50 )/ (50 - 32 ) = 2

Ratio Data:

අන්තිම data වර්ගය තමයි "Ratio Data" කියන්නෙ. Ratio Data වලට මං මුලින් කියපු සෑම data වර්ගෙකම ලක්ෂණ එලෙසින්ම තියනවා. ඒත් මේකෙ  තියන වෙනස තමයි, ratio data වලට true zero එකක් තියනව. ඇත්තම ඇත්ත බින්දුවක් තියනවා.

උදාහරණ තමයි: height, weight, length, area, etc

බලන්න මේවා zero උනොත් මොකෝ වෙන්නෙ කියලා.. weight එක zero කියන්නෙ එතන මිනිහෙක් නෑ කියන එකනෙ. height, length වුනත් එහෙමයි. Ratio data වලට true zero එකක් තියනවා.

ඔන්න ඔය විදිහට තමයි සංඛ්‍යානයේදි data වර්ගීකරණය කොරන්නේ...

    11 comments:

    1. කුළුඳුලේ පටන්ගත්ත බ්ලොග් එකට මගේ සුභ පැතුම්. කැම්පස් එකේ ඉන්න කාලේ වහ කදුරු වගේ තිත්ත stat උගන්නන්න ආපු ලෙචාලා ඒවා තවත් එපා කළා. උඹේ කුප්පි නොතිබ්බා නම් අපේ බැච් එකේ ගොඩක් උන් තාම අන්දොස්.

      කරගෙන යන වැඩේ දිගටම කරගෙන යන්න සුභ පැතුම්. මේක ඉගෙනගන්න ගොඩක් අයට ප්‍රයෝජනවත් බ්ලොග් එකක් වේවි.......

      ReplyDelete
    2. උණුසුම් සුබ පැතුම් මලයා... විය යත්තේ මෙවන් දේවල් තමයි..

      ReplyDelete
      Replies
      1. බොහොම ස්තූතියි සහෝදරයා... මේ ටිකේම ෆුල් බිසී. අද ඉඳන් ෆ්‍රී.. ඒ නිසා ආයෙමත් බ්ලොග පටන් ගන්නවා

        Delete
    3. මේක නියම උත්සාහයක් ඉදිරියටම යන්න හදවතින්ම සුබ පැතුම්. වර්ඩ් වෙරිෆීකේෂන් අයින් කරන්න නැතිනම් කමෙන්ට් කරන්න අමාරුයි.

      ReplyDelete
      Replies
      1. මේ ටිකේම ෆුල් බිසී. අද ඉඳන් තමයි ෆ්‍රී වුනේ.. අද ඉඳන් බ්ලොග ආයෙමත් අක්ටිව් කරනවා.. මොකක්ද මචං වර්ඩ් වෙරිෆිකේශන් කියන්නෙ??? මං බ්ලොග් වලට අලුත් නේ.. තැන්කූ කොමෙන්ටුවට..

        Delete
    4. ගොඩක් වටිනවා සහෝ. දිගටම කරගෙන යන්න. තව ටිකක් මේක ලිඛිත බසින් කරා නම් හොඳයි වගේ. (ඒක අදහසක් විතරයි. මෙහෙමත් වරදක් නෑ)

      ReplyDelete
    5. ගොඩක් වැදගත් සයිට් එකක්. හිමීට ඇවිත් කියවලා යන්නම්කෝ

      ReplyDelete
    6. සංඛ්‍යානය ගැන නෝට් තව නැද්ද.. ගොඩාක් හොදට තේරෙනවා

      ReplyDelete
    7. බොහොම ස්තුති

      ReplyDelete