לדלג לתוכן

נתונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
המונח "נתון" מפנה לכאן. אם הכוונה למשמעות אחרת, ראו נתון (פירושונים).

נתון – ברבים נתונים (דָּאטָה; מאנגלית: Data) הוא תיאור כמותי (על ידי מספר) של מכלול פריטים או תופעות מהמציאות או מהדמיון אשר גודלם נמדד בעזרת יחידות מידה. או בקצרה: דבר מה מדוד.

אטימולוגיה

[עריכת קוד מקור | עריכה]

משמעות המילה נתון היא "דבר מה שניתן". משמעות זו מקבילה למשמעות המילה הלטינית datum.[1] עם הזמן המילה קיבלה משמעות של "דבר מה בעל גודל שנמדד" בלבד.

נתונים יכולים להתקבל בכל תחום לדוגמה:

  • "מספר התלמידים בכיתות א' בכל עיר בישראל בשנת 2020"
  • "כמות ימי הגשם בכל שנה באירופה משנת 1980 עד 2000"
  • "שעות עבודה שבועיות של פועל בניין בסין במאה ה-20"

נתונים במדעי המחשב

[עריכת קוד מקור | עריכה]

במדעי המחשב "נתונים" הם רשומות של אובייקטים – פרטי מידע הנכנסים כקלט לתוך מערכת מידע (במובן הכללי שלה: מערכת המעבדת נתונים ומפיקה פלט).

בתחום המחשוב נעשית לרוב הבחנה בין נתונים גולמיים למידע: נתונים הם אוסף של מספרים, אותיות וסמלים, ומידע מוגדר כנתונים שעברו עיבוד. לדוגמה: ממוצע של נתוני משכורת הוא עיבוד של נתונים קיימים. התוצאה שהתקבלה, יכולה כשלעצמה להפוך לנתון. כלומר הקניית הערך שהתקבל כתוצאת החישוב, למשתנה משכורת ממוצעת. במקרים רבים תהליכי עיבוד הם בעלי שלבים רבים, כך שתוצר העיבוד של שלב אחד הופך לנתון גולמי של תהליך העיבוד הבא. כמו כן, במקרים רבים המידע המבוקש מן המערכת, הוא נתון שקיים בה, לדוגמה המשכורת של עובד מסוים. והעיבוד שנעשה הוא הגישה למערכת והוצאת הנתון.

במחשב, הנתונים מיוצגים בייצוג בינארי, כך שרצף סיביות מייצג תו (אות, מספר או סימן). במחשב אנלוגי הנתונים מיוצגים על ידי גדלים פיזיקליים. מרבית המחשבים האנלוגיים הם חשמליים והנתונים מיוצגים בהם לרוב על ידי מתח או זרם. במחשבים אנלוגיים מכניים הנתונים מיוצגים על ידי מרחק או מיקום.

ניתן לאחסן את הנתונים בזיכרון המחשב באופנים שונים, לצורך ניהול ושליפה מהירה. לשיטה שבה הנתונים מאוחסנים, מבנה נתונים, יש חשיבות עבור אלגוריתמים שונים. אחת השיטות הנפוצות ביותר לאחסון כמות רבה של נתונים היא מסד נתונים. אוסף גדול של מסדי נתונים מוגדר כמחסן נתונים.

עבור מחסני הנתונים מוגדרים כלים סטטיסטיים, המבצעים כריית מידע, כלומר מציאת קשרים סטטיסטיים בין נתונים שונים, שיכולים להעיד על קיום קשרים כאלו בפועל. לדוגמה: מתוך נתוני מכירות, מציאת קשר בין יום בשבוע לבין סוג הקונים שמגיעים לבצע קניות ברשת השיווק באותו יום.

בעת הזנת נתונים למערכת מידע נבדקת תקינותם של הנתונים, כדי להבטיח את אמינותם. חרף זאת, במהלך פעילותה של מערכת מידע, ובפרט במעבר למערכת מידע מתקדמת יותר, עולה צורך בטיוב הנתונים, כלומר שיפור איכותם של הנתונים שנאגרו במערכת. צורך זה נובע בדרך כלל מטעויות או חוסרים בנתונים המקוריים, או מטעויות הקלדה שלא התגלו בעת הזנת בנתונים לשם אחסונם במסד נתונים.

קישורים חיצוניים

[עריכת קוד מקור | עריכה]

הערות שוליים

[עריכת קוד מקור | עריכה]