مقدمه
سنجش از دور به عنوان یک ابزار قوی در جمعآوری دادههای محیطی، روز به روز در حال گسترش و تحول است. این تکنولوژی با استفاده از سنسورهای هوایی و فضایی، اطلاعاتی دقیق و وسیع را در مورد گوشههای مختلف زمین، از تغییرات زیستمحیطی تا تحولات اجتماعی و اقتصادی، ارایه میدهد. اما یکی از جنبههای کلیدی که موجب مفیدتر شدن این دادهها میشود، استفاده از آمار است.
آمار نه تنها به ما کمک میکند تا دادههای خام را تحلیل کنیم، بلکه به ما امکان میدهد تا الگوها، روندها و روابط موجود در دادهها را شناسایی کنیم. همچنین، با کمک روشهای آماری میتوان به تقویت دقت و صحت نتایج حاصل از سنجش از دور پرداخت و به استخراج اطلاعات بیشتر و معتبرتر دست یافت.
در این راستا، ترکیب دادههای سنجش از دور و تکنیکهای آماری زمینهساز پیشرفتهای جدیدی در علوم اجتماعی، محیطزیست، کشاورزی و بسیاری از حوزههای دیگر شده است.
آمار توصیفی در تفسیر تصاویر ماهوارهای:
بهطور کلی آمار توصیفی، توصیفی از وضعیت کلی دادهها بوده و معمولا" شامل میانگین، میانه، مد، حداقل، حداکثر و محدوده اعداد است. آمار توصیفی از مفاهیم اساسی علم آمار بوده که به تحلیل دادهها کمک میکند.
در ادامه به تعریف هر یک از این مفاهیم پرداخته شده است:
میانگین، که به عنوان میانگین حسابی نیز شناخته میشود، مجموع تمامی مقادیر یک مجموعه داده را تقسیم بر تعداد آن مقادیر میکند.
Mean=SumXi/n
که در آن:
SumXi: مجموع مقادیر موجود و
n: تعداد آن مقادیر است.
میانگین درجات روشنایی(DN)، نشاندهنده میزان بازتاب(Reflectance) پدیدههای موجود در تصویر ماهوارهای است. بهطور مثال اگر میانگین اعداد یا درجات روشنایی یک تصویر 20 باشد، میتواند نشاندهنده فراوانی بالای عارضه یا کاربری و یا هر موضوعی با بازتاب نزدیک به 20 باشد.
میانه (Median)
میانه، مقداری است که دادهها را به دو نیمه مساوی تقسیم میکند. برای محاسبه میانه، ابتدا باید دادهها را به ترتیب از کوچک به بزرگ مرتب کرد. اگر تعداد دادهها فرد باشد، میانه مقدار وسطی خواهد بود و اگر تعداد دادهها زوج باشد، میانه میانگین دو مقدار وسطی است.
عددی که میانه درجات روشنایی یک تصویر است احتمالا" نشان میدهد کدام عارضه یا پدیده و یا کاربری خاص از لحاظ بازتاب، حد واسط بازتابهای کل تصویر است.
مد، مقدار یا مقادیر موجود در یک مجموعه داده است که بیشترین تکرار را دارند. یک مجموعه داده میتواند دارای یک مد (مونو مد)، چند مد (مالتی مد) یا بدون مد (اگر هیچ مقداری بیش از یک بار تکرار نشود) باشد.
واریانس، معیاری برای سنجش پراکندگی دادهها نسبت به میانگین آنهاست. محاسبه واریانس به شکل زیر انجام میشود:
Var=Sum((Xi-Mean)^2)/n
که در آن:
Xi: هر کدام از دادههای مجموع داده
Mean: میانگین مجموع دادهها
n: تعداد مقادیر یا داده
واریانس به ما نشان میدهد که دادهها چقدر از میانگین فاصله دارند.
انحراف معیار، جذر واریانس است و نشاندهنده میزان پراکندگی دادهها در یک مجموعه است.
انحراف معیار، معیاری ساده و کاربرپسند است که به راحتی قابل تفسیر میباشد و نشان میدهد که دادهها به طور متوسط چقدر از میانگین خود فاصله دارند.
واریانس و انحراف میزان ناهمگنی تصویر ماهوارهای را نشان میدهد. بهطور مثال چنانچه هدف ما بررسی کاربری اراضی است، واریانس و انحراف بالا نشاندهنده تنوع کاربری در اراضی مربوط به تصویر ماهوارهای میباشد.
این مفاهیم پایه، ابزارهای مهمی برای تحلیل دادهها و درک توزیع و رفتار آنها در آمار هستند.
آمار و روشهای آماری در تفسیر تصاویر سنجش از دور
هیستوگرام،نمودار فراوانی بر حسب درجه روشنایی است و استفاده های زیر رامی توان از آن به عمل آورد:
1- پی بردن به پراکنش دامنهی اطلاعاتی هرپدیده و مطالعه تنوع پدیده ها
دامنه هیستوگرام نشان میدهد دامنه درجات روشنایی و بازتاب پدیدهها در چه محدودهای قرار دارد. همچنین وجود شکستگیها و قلههای متعدد نشاندهنده تنوع پدیدههای موجود در تصویر است.
2- بررسی وضعیت کنتراست تصویر و افزایش آن
چنانچه محدوده هیستوگرام همه محدوده قدرت تفکیک رادیومتریک تصویر را پوشش ندهد، کنتراست تصویر پایین بوده و برای بهبود آن، باید از روشهای بسط تصویر (Image stretching) استفاده نموده و نتایج را در هیستوگرام تصویر اصلاحی مجددا" چک نمود.
3- بررسی تشابهات وهم پوشانی دامنه اطلاعاتی در باندهای مختلف تصاویر ماهوارهای
تشابه هیستوگرامهای باندهای مختلف یک تصویر، نشاندهنده همبستگی بالای باندها بوده و لذا استفاده همزمان از این باندها، کمکی به افزایش صحت نتایج تحلیلها مثلا" طبقهبندی نمیکند.
همبستگی بین باندهای مختلف یک تصویر با ماتریس همبستگی میگردد. بدیهی است. بهترین ترکیب دوباندی برای تحلیلها(مثلا" طبقهبندی) ترکیبی است که باندها با یکدیگر کمترین همبستگی را داشته باشند.
به حالتی که واریانس بین باندهای مختلف محاسبه میشود کواریانس میگویند که، مانند واریانس نشاندهنده پراکندگی دو باند است. این مشخصه نیز مانند همبستگی با ماتریس بیان شده و ماتریس واریانس- کواریانس نام دارد اما بر عکس ماتریس همبستگی، ترکیب دو باندی با مقادیر کواریانس بیشتر برای تحلیلها در سنجش از دور مناسبتر میباشند.
-شاخصهای آماری تحلیل چند متغیره
این شاخصها بسیار کلیدی مهم بوده و هر کدام کاربردهای متفاوتی دارند. که معروفترین آنها رگرسیونها(Regression)، انواع خوشهبندی(Clustering) و آنالیز مولفههای اصلی(principal component analysis) میباشد.