پیدایش و طبقه بندی خاکها
مستانه رحیمی مشکله؛ محمد امیر دلاور؛ محمد جمشیدی؛ امین شریفی فر
چکیده
علیرغم استفاده گسترده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، محدودیت های مربوط به عدم تعادل کلاس های خاک مانع عملکرد موفقیتآمیز بسیاری از الگوریتم های یادگیری ماشین در این روش ها شده است. از اینرو هدف از این پژوهش بهبود عملکرد مدل سازی دادههای نامتعادل خاک با استفاده از روش پیش درمانی نمونه گیری مجدد در سه مدل پیش ...
بیشتر
علیرغم استفاده گسترده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، محدودیت های مربوط به عدم تعادل کلاس های خاک مانع عملکرد موفقیتآمیز بسیاری از الگوریتم های یادگیری ماشین در این روش ها شده است. از اینرو هدف از این پژوهش بهبود عملکرد مدل سازی دادههای نامتعادل خاک با استفاده از روش پیش درمانی نمونه گیری مجدد در سه مدل پیش بینی شامل جنگل تصادفی، درخت تصمیم توسعه یافته و رگرسیون لجستیک چندجمله ای در بخشی از اراضی استان زنجان است. برای این منظور موقعیت 148 خاک رخ مشاهداتی بر اساس الگوی شبکهبندی منظم با فاصله 500 متر حفر و بر اساس استانداردهای سیستم جامع رده بندی خاک تشریح و طبقه بندی گردید. متغیرهای محیطی شامل اطلاعات نقشه های ژئومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهوارهای لندست 8 بودند که بر اساس نظر کارشناسی و رویکرد تحلیل مؤلفه اصلی تعدادی از متغیرهای محیطی بهعنوان مؤثرترین متغیرهای محیطی و ورودی مدل انتخاب گردید. مدل سازی با استفاده از دادههای نامتعادل، منجر به از دست دادن کلاسهای با مشاهده های کم تعداد برای هر سه مدل بود. در این شرایط مدل رگرسیون لجستیک چندجملهای بالاترین دقت (66%) و ضریب کاپا (0/41) را نسبت به دو مدل دیگر نشان داد. پس از نمونه برداری مجدد داده ها در قالب فرآیند متعادل سازی، مدل درخت تصمیم توسعهیافته با حفظ کلاس های کم تعداد با صحت کلی 75% و ضریب کاپا 0/64 در پیشبینی مکانی زیرگروه های خاک، برآورد قابل قبولی ارائه داد.