Перехресна перевірка включає методи повторної вибірки та поділу вибірки, які використовують різні частини даних для тестування та навчання моделі на різних ітераціях. Він часто використовується в налаштуваннях, де метою є передбачення, і потрібно оцінити, наскільки точно прогностична модель працюватиме на практиці.
Крива перевірки є графік, що показує результати на наборах для навчання та перевірки в залежності від складності моделі: якщо дві криві розташовані близько одна до одної і обидві похибки великі, це ознака недостатнього підгонки. якщо дві криві знаходяться далеко одна від одної, це ознака переобладнання.
Метою перехресної перевірки є щоб забезпечити кращу оцінку здатності моделі працювати з невидимими даними. Він забезпечує неупереджену оцінку помилки узагальнення, особливо у випадку обмежених даних. Є багато причин, чому ми можемо захотіти це зробити: Щоб мати чіткішу оцінку ефективності нашої моделі.
Перехресна перевірка в основному використовується в прикладному машинному навчанні оцінити майстерність моделі машинного навчання на невидимих даних. Тобто, використовувати обмежену вибірку, щоб оцінити, як очікується, що модель працюватиме в цілому, коли вона використовується для прогнозування даних, які не використовувалися під час навчання моделі.
Метою перехресної перевірки є перевірити здатність моделі машинного навчання передбачати нові дані. Він також використовується для позначення проблем, таких як переобладнання або зміщення вибору, і дає зрозуміти, як модель узагальнюватиметься в незалежному наборі даних.