پیدایش و طبقه بندی خاکها
مستانه رحیمی مشکله؛ محمد امیر دلاور؛ محمد جمشیدی
چکیده
طبقه بندی داده های نامتعادل به یک موضوع تحقیقاتی مهم در زمینه داده کاوی تبدیل شده است. هدف از انجام این پژوهش شناسایی صحیح نمونه های کلاس اقلیت و افزایش دقت طبقه بندی کلاس های خاک با استفاده از رویکرد مدل تجمعی در بخشی از اراضی جنوب غربی استان زنجان است. تعداد 148 خاکرخ با روش الگوی شبکهبندی منظم و میانگین فاصله 500 متر حفر، تشریح و با ...
بیشتر
طبقه بندی داده های نامتعادل به یک موضوع تحقیقاتی مهم در زمینه داده کاوی تبدیل شده است. هدف از انجام این پژوهش شناسایی صحیح نمونه های کلاس اقلیت و افزایش دقت طبقه بندی کلاس های خاک با استفاده از رویکرد مدل تجمعی در بخشی از اراضی جنوب غربی استان زنجان است. تعداد 148 خاکرخ با روش الگوی شبکهبندی منظم و میانگین فاصله 500 متر حفر، تشریح و با تجزیه و تحلیل آزمایشگاهی تا سطح فامیل رده بندی گردید. مناسب ترین متغیرهای محیطی بر اساس نظر کارشناسی و رویکرد تحلیل مؤلفه اصلی از میان 57 متغیر شامل اطلاعات نقشه های ژئومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهوارهای لندست 8 برای پیش بینی کلاس های خاک انتخاب شد. مدلسازی رابطه خاک - زمین نما با استفاده از الگوریتم های یادگیرنده جنگل تصادفی، درخت تصمیم توسعهیافته و رگرسیون لجستیک چندجمله ای و مدل تجمعی (بعد از متعادل سازی داده ها) در محیط نرمافزار "Rstudio" انجام شد. صحت کلی و ضریب کاپا برای ارزیابی کلاس های خاک در سطح زیرگروه به ترتیب در مدل های فردی رگرسیون لجستیک چندجمله ای 65 درصد و 0/41، جنگل تصادفی 65 درصد و 0/32، درخت تصمیم توسعهیافته 60 درصد و 0/35 و در مدل تجمعی 70 درصد و 0/62 به دست آمد. نتایج صحت کاربر و صحت تولیدکننده نشان داد در میان مدل های فردی، مدل رگرسیون لجستیک چندجمله ای دقت بالاتری در پیش بینی کلاس های خاک دارد.
پیدایش و طبقه بندی خاکها
مستانه رحیمی مشکله؛ محمد امیر دلاور؛ محمد جمشیدی؛ امین شریفی فر
چکیده
علیرغم استفاده گسترده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، محدودیت های مربوط به عدم تعادل کلاس های خاک مانع عملکرد موفقیتآمیز بسیاری از الگوریتم های یادگیری ماشین در این روش ها شده است. از اینرو هدف از این پژوهش بهبود عملکرد مدل سازی دادههای نامتعادل خاک با استفاده از روش پیش درمانی نمونه گیری مجدد در سه مدل پیش ...
بیشتر
علیرغم استفاده گسترده از روش های نقشه برداری رقومی خاک در مطالعات خاکشناسی، محدودیت های مربوط به عدم تعادل کلاس های خاک مانع عملکرد موفقیتآمیز بسیاری از الگوریتم های یادگیری ماشین در این روش ها شده است. از اینرو هدف از این پژوهش بهبود عملکرد مدل سازی دادههای نامتعادل خاک با استفاده از روش پیش درمانی نمونه گیری مجدد در سه مدل پیش بینی شامل جنگل تصادفی، درخت تصمیم توسعه یافته و رگرسیون لجستیک چندجمله ای در بخشی از اراضی استان زنجان است. برای این منظور موقعیت 148 خاک رخ مشاهداتی بر اساس الگوی شبکهبندی منظم با فاصله 500 متر حفر و بر اساس استانداردهای سیستم جامع رده بندی خاک تشریح و طبقه بندی گردید. متغیرهای محیطی شامل اطلاعات نقشه های ژئومورفولوژی و زمین شناسی، مدل رقومی ارتفاع و داده های حاصل از تصاویر ماهوارهای لندست 8 بودند که بر اساس نظر کارشناسی و رویکرد تحلیل مؤلفه اصلی تعدادی از متغیرهای محیطی بهعنوان مؤثرترین متغیرهای محیطی و ورودی مدل انتخاب گردید. مدل سازی با استفاده از دادههای نامتعادل، منجر به از دست دادن کلاسهای با مشاهده های کم تعداد برای هر سه مدل بود. در این شرایط مدل رگرسیون لجستیک چندجملهای بالاترین دقت (66%) و ضریب کاپا (0/41) را نسبت به دو مدل دیگر نشان داد. پس از نمونه برداری مجدد داده ها در قالب فرآیند متعادل سازی، مدل درخت تصمیم توسعهیافته با حفظ کلاس های کم تعداد با صحت کلی 75% و ضریب کاپا 0/64 در پیشبینی مکانی زیرگروه های خاک، برآورد قابل قبولی ارائه داد.