آمار، کلید موفقیت سنجش از دور: چگونه داده‌ها به تصمیم‌گیری‌های دقیق‌تر کمک می‌کنند

مقدمه

سنجش از دور به عنوان یک ابزار قوی در جمع‌آوری داده‌های محیطی، روز به روز در حال گسترش و تحول است. این تکنولوژی با استفاده از سنسورهای هوایی و فضایی، اطلاعاتی دقیق و وسیع را در مورد گوشه‌های مختلف زمین، از تغییرات زیست‌محیطی تا تحولات اجتماعی و اقتصادی، ارایه می‌دهد. اما یکی از جنبه‌های کلیدی که موجب مفیدتر شدن این داده‌ها می‌شود، استفاده از آمار است.

آمار نه تنها به ما کمک می‌کند تا داده‌های خام را تحلیل کنیم، بلکه به ما امکان می‌دهد تا الگوها، روندها و روابط موجود در داده‌ها را شناسایی کنیم. همچنین، با کمک روش‌های آماری می‌توان به تقویت دقت و صحت نتایج حاصل از سنجش از دور پرداخت و به استخراج اطلاعات بیشتر و معتبرتر دست یافت.

در این راستا، ترکیب داده‌های سنجش از دور و تکنیک‌های آماری زمینه‌ساز پیشرفت‌های جدیدی در علوم اجتماعی، محیط‌زیست، کشاورزی و بسیاری از حوزه‌های دیگر شده است.

آمار توصیفی در تفسیر تصاویر ماهواره‌ای:

به‌طور کلی آمار توصیفی، توصیفی از وضعیت کلی داده‌ها بوده و معمولا" شامل میانگین، میانه، مد، حداقل، حداکثر و محدوده اعداد است. آمار توصیفی از مفاهیم اساسی علم آمار بوده که به تحلیل داده‌ها کمک می‌کند.

در ادامه به تعریف هر یک از این مفاهیم پرداخته شده است:

  • میانگین(Mean)

میانگین، که به عنوان میانگین حسابی نیز شناخته می‌شود، مجموع تمامی مقادیر یک مجموعه داده را تقسیم بر تعداد آن مقادیر می‌کند.

Mean=SumXi/n

که در آن:

 SumXi: مجموع مقادیر موجود و

 n: تعداد آن مقادیر است.

میانگین درجات روشنایی(DN)، نشان‌دهنده میزان بازتاب(Reflectance) پدیده‌های موجود در تصویر ماهواره‌ای است. به‌طور مثال اگر میانگین اعداد یا درجات روشنایی یک تصویر 20 باشد، می‌تواند نشان‌دهنده فراوانی بالای عارضه یا کاربری و یا هر موضوعی با بازتاب نزدیک به 20 باشد.

میانه (Median)

میانه، مقداری است که داده‌ها را به دو نیمه مساوی تقسیم می‌کند. برای محاسبه میانه، ابتدا باید داده‌ها را به ترتیب از کوچک به بزرگ مرتب کرد. اگر تعداد داده‌ها فرد باشد، میانه مقدار وسطی خواهد بود و اگر تعداد داده‌ها زوج باشد، میانه میانگین دو مقدار وسطی است.

عددی که میانه درجات روشنایی یک تصویر است احتمالا" نشان می‌دهد کدام عارضه یا پدیده و یا کاربری خاص از لحاظ بازتاب، حد واسط بازتاب‌های کل تصویر است.

  • مد (Mode)

مد، مقدار یا مقادیر موجود در یک مجموعه داده است که بیشترین تکرار را دارند. یک مجموعه داده می‌تواند دارای یک مد (مونو مد)، چند مد (مالتی مد) یا بدون مد (اگر هیچ مقداری بیش از یک بار تکرار نشود) باشد.

  • واریانس(Variance)

واریانس، معیاری برای سنجش پراکندگی داده‌ها نسبت به میانگین آن‌هاست. محاسبه واریانس به شکل زیر انجام می‌شود:

Var=Sum((Xi-Mean)^2)/n

که در آن:

Xi: هر کدام از داده‌های مجموع داده

Mean: میانگین مجموع داده‌ها

n: تعداد مقادیر یا داده

واریانس به ما نشان می‌دهد که داده‌ها چقدر از میانگین فاصله دارند.

  • انحراف معیار (Standard Deviation)

انحراف معیار، جذر واریانس است و نشان‌دهنده میزان پراکندگی داده‌ها در یک مجموعه است.

انحراف معیار، معیاری ساده و کاربرپسند است که به راحتی قابل تفسیر می‌باشد و نشان می‌دهد که داده‌ها به طور متوسط چقدر از میانگین خود فاصله دارند.

واریانس و انحراف میزان ناهمگنی تصویر ماهواره‌ای را نشان می‌دهد. به‌طور مثال چنان‌چه هدف ما بررسی کاربری اراضی است، واریانس و انحراف بالا نشان‌دهنده تنوع کاربری در اراضی مربوط به تصویر ماهواره‌ای می‌باشد.

این مفاهیم پایه، ابزارهای مهمی برای تحلیل داده‌ها و درک توزیع و رفتار آن‌ها در آمار هستند.

آمار و روش‌های آماری در تفسیر تصاویر سنجش از دور

  • هیستوگرام

هیستوگرام،نمودار فراوانی بر حسب درجه روشنایی است و استفاده های زیر رامی توان از آن به عمل آورد:

1- پی بردن به پراکنش دامنه‌ی اطلاعاتی هرپدیده و مطالعه تنوع پدیده ها

دامنه هیستوگرام نشان می‌دهد دامنه درجات روشنایی و بازتاب پدیده‌ها در چه محدوده‌ای قرار دارد. هم‌چنین وجود شکستگی‌ها و قله‌های متعدد نشان‌دهنده تنوع پدیده‌های موجود در تصویر است.

2- بررسی وضعیت کنتراست تصویر و افزایش آن

چنان‌چه محدوده هیستوگرام همه محدوده قدرت تفکیک رادیومتریک تصویر را پوشش ندهد، کنتراست تصویر پایین بوده و برای بهبود آن، باید از روش‌های بسط تصویر (Image stretching) استفاده نموده و نتایج را در هیستوگرام تصویر اصلاحی مجددا" چک نمود.

3- بررسی تشابهات وهم پوشانی دامنه اطلاعاتی در باندهای مختلف تصاویر ماهواره‌ای

تشابه هیستوگرام‌های باندهای مختلف یک تصویر، نشان‌دهنده همبستگی بالای باندها بوده و لذا استفاده هم‌زمان از این باندها، کمکی به افزایش صحت نتایج تحلیل‌ها مثلا" طبقه‌بندی نمی‌کند.

  • همبستگی(Correlation) بین باندها

همبستگی بین باندهای مختلف یک تصویر با ماتریس همبستگی می‌گردد. بدیهی است. بهترین ترکیب دوباندی برای تحلیل‌ها(مثلا" طبقه‌بندی) ترکیبی است که باندها با یکدیگر کمترین همبستگی را داشته باشند.

  • واریانس- کواریانس بین باندها

به حالتی که واریانس بین باندهای مختلف محاسبه می‌شود کواریانس می‌گویند که، مانند واریانس نشان‌دهنده پراکندگی دو باند است. این مشخصه نیز مانند همبستگی با ماتریس بیان شده و ماتریس واریانس- کواریانس نام دارد اما بر عکس ماتریس همبستگی، ترکیب دو باندی با مقادیر کواریانس بیشتر برای تحلیل‌ها در سنجش از دور مناسب‌تر می‌باشند.

-شاخص‌های آماری تحلیل چند متغیره

این شاخص‌ها بسیار کلیدی مهم بوده و هر کدام کاربردهای متفاوتی دارند. که معروف‌ترین آنها رگرسیون‌ها(Regression)، انواع خوشه‌بندی(Clustering) و آنالیز مولفه‌های اصلی(principal component analysis) می‌باشد.