Содержание

Изменение графика работы при суммированном учете

]]>

Подборка наиболее важных документов по запросу Изменение графика работы при суммированном учете (нормативно–правовые акты, формы, статьи, консультации экспертов и многое другое).

Формы документов: Изменение графика работы при суммированном учете

Судебная практика: Изменение графика работы при суммированном учете Открыть документ в вашей системе КонсультантПлюс:
Подборка судебных решений за 2020 год: Статья 99 “Сверхурочная работа” Трудового кодекса РФ”Учитывая установление работнику в соответствии с правилами внутреннего трудового распорядка суммированного учета рабочего времени, включение в график работы Г. в спорный период июнь – сентябрь 2018 года девятичасовых рабочих смен не свидетельствует о нарушении работодателем статьи 99 Трудового кодекса Российской Федерации, об устранении которого указано в оспариваемом предписании.”

Статьи, комментарии, ответы на вопросы: Изменение графика работы при суммированном учете Открыть документ в вашей системе КонсультантПлюс:

Путеводитель по кадровым вопросам. Рабочее время- график сменности (при сменной работе с суммированным учетом рабочего времени). В графике сменности учитываются смены работников за вычетом часов, отработанных сверхурочно. К примеру, в графике смен магазина установлено, что лица, работавшие в предпраздничный день полную смену (без сокращения на один час), выходят по очереди в следующие рабочие дни на работу на час позже (т.е. один работник выходит на час позже в понедельник, второй – во вторник и т.д.). Следует помнить, что графики сменности должны быть доведены до сведения работников не менее чем за месяц до их введения в действие (ст. 103 ТК РФ). Необходимо отметить, что данный вариант может быть применен в том случае, если в организации предусмотрены работники, которые могут подменять тех, кто выходит на работу позже из-за предоставления дополнительного времени отдыха. Иначе возникает ситуация, когда для замены отдыхающего приходится привлекать другого работника к сверхурочной работе или работе в выходной день;

Нормативные акты: Изменение графика работы при суммированном учете “Уголовно-исполнительный кодекс Российской Федерации” от 08.01.1997 N 1-ФЗ
(ред. от 11.06.2021)1. Продолжительность рабочего времени осужденных к лишению свободы, правила охраны труда, техники безопасности и производственной санитарии устанавливаются в соответствии с законодательством Российской Федерации о труде. Время начала и окончания работы (смены) определяется графиками сменности, устанавливаемыми администрацией исправительного учреждения по согласованию с администрацией предприятия, на котором работают осужденные.

Образец трудового договора с суммированным учетом рабочего времени с периодом 1 год

Для того чтобы установить такого вида учет, положение о его введении должно быть указано в правилах внутреннего трудового распорядка работодатель определяет самостоятельно, в каких случаях, каким порядком и на какой период вводится. Для работников, занятых на вредных или опасных условиях труда, учетный период не может превышать трех месяцев квартал. Однако если существуют объективные причины сезонного или технологического характера, этот период может быть увеличен, но на срок не более одного года. Данная возможность должна быть прописана:. Если данная норма в указанных документах отсутствует, работодатель не может превышать учетный период, равный трем месяцам. Либо он должен внести изменения в коллективный договор и только потом увеличивать период.

ВИДЕО ПО ТЕМЕ: Суммированный учет рабочего времени. Разбираем самые сложные вопросы.

Дорогие читатели! Наши статьи рассказывают о типовых способах решения юридических вопросов, но каждый случай носит уникальный характер.

Если вы хотите узнать, как решить именно Вашу проблему – обращайтесь в форму онлайн-консультанта справа или звоните по телефонам, представленным на сайте. Это быстро и бесплатно!

Суммированный учет рабочего времени

Если в компании сотрудники трудятся более 8 часов в день, то без суммированного учета рабочего времени работодателю не обойтись. Ведь именно этот способ учета позволяет контролировать, соблюдается ли норма рабочего времени, имеются ли у работников часы сверхурочной работы и сколько именно. ТК РФ устанавливает нормы рабочего времени: не более 8 часов в день и 40 часов в неделю. Действительно, в некоторых компаниях работники приходят на работу утром в 9.

Однако реальная жизнь нередко отклоняется от нормы, в том числе и в отношении рабочего времени. Некоторые из таких отклонений описаны в ТК РФ, в частности, в ст.

Например, фрезеровщики на заводе с непрерывными процессами всего производства работают в три смены в сутки, сменяя друг друга сменная работа , или продавцы в магазине трудятся по 12 часов два дня, а потом два дня отдыхают работа по графику — это как раз повод ввести суммированный учет. В таких случаях сотрудники работают по специально разработанному графику и для расчета их рабочего времени вводится суммированный учет.

Делается это для того, чтобы проверять, что установленная законодательством норма рабочего времени соблюдается в рамках учетного периода.

Обратите внимание, хотя ст. К сведению. По общему правилу, необходимость введения суммированного учета определяет работодатель. Но иногда нормативные правовые акты рекомендуют это сделать, например, если работнику установлен гибкий график см. В некоторых случаях нормативные правовые акты прямо обязывают ввести суммированный учет, например при вахтовом методе работы см.

Рассмотрим, как правильно ввести суммированный учет рабочего времени в соответствии с законодательством. Порядок установления суммированного учета рабочего времени может быть различным.

Как правило, сначала вносятся изменения или дополнения в правила внутреннего трудового распорядка ПВТР. С момента вступления в силу таких изменений или дополнений в компании может применяться суммированный учет в отношении отдельных работников.

Но пока он не вводится, а только закрепляется возможность его применения. Поэтому в приказе об изменениях или дополнениях в ПВТР, как правило, не говорится о датах введения суммированного учета. Издается отдельный приказ о введении суммированного учета рабочего времени для конкретных должностей профессий. То есть таким образом реализуется потенциальная возможность, предусмотренная в ПВТР. В этом случае сотрудников необходимо уведомить по ст. Делать это не придется, если работники согласны с введением для них суммированного учета рабочего времени.

Такая ситуация возможна, если у них по факту работа по графику, но она не была в компании регламентирована. Однако если есть несогласные а такое вполне реально, когда сотрудники изначально работали с до , а теперь их переводят на работу по графику , то избежать процедуры уведомления по ст. Рассмотрим каждый этап процедуры подробнее. В силу ч. Образец приказа приведен в Примере 1. Общество с ограниченной ответственностью “Дефис”.

В связи с возможностью перехода на новый режим обслуживания покупателей магазинов ООО “Дефис” приказываю: Дополнить Правила внутреннего трудового распорядка разделом, устанавливающим режим работы по графику и суммированный учет рабочего времени: “5. Работа по графику с суммированным учетом рабочего времени. Для отдельных категорий работников приложение 3 к Правилам внутреннего трудового распорядка продолжительность рабочего дня определяется в соответствии с графиком работ, утверждаемым работодателем.

Дата и время выхода каждого работника на работу, продолжительность работы, время окончания работы, выходные дни устанавливаются графиком работы. График работы объявляется работникам под личную подпись не позднее чем за два месяца до введения его в действие. Продолжительность рабочего дня при работе по графику составляет 12 часов. Перерыв для отдыха и питания 30 минут предоставляется каждые 4 часа работы. Продолжительность еженедельного непрерывного отдыха не может быть менее 42 часов.

Все работники обязаны приходить на работу в то время, которое определено графиком. Все отклонения от графика работы в обязательном порядке согласовываются работником с непосредственным руководителем. Для работников, занимающих должности в соответствии с приложением 3 к Правилам внутреннего трудового распорядка, применяется суммированный учет рабочего времени. Учетный период при суммированном учете рабочего времени составляет три месяца.

Нормальное число рабочих часов за учетный период исчисляется по расчетному графику исходя из часовой рабочей недели. При подсчете нормы рабочего времени для конкретного работника за учетный период часы, приходящиеся на периоды, когда работник не работал, но за ним сохранялось место работы временная нетрудоспособность, все виды отпусков и т.

Подсчет фактически отработанных работником часов производится ежедневно и нарастающим итогом суммарно за учетный период. Общая продолжительность фактической работы конкретного работника в целом за учетный период не должна превышать нормального числа рабочих часов.

Оплата труда производится ежемесячно по фактически отработанному в расчетном месяце времени. Сверхурочная работа, как правило, не допускается. Применение сверхурочной работы может производиться в пределах и на условиях, предусмотренных действующим законодательством. По истечении и по итогам учетного периода на основании табелей и приказов по Организации оплачиваются рабочие часы, отработанные сверх нормы рабочего времени за учетный период в соответствии с действующим законодательством.

Сверхурочная работа при суммированном учете рабочего времени оплачивается в полуторном размере за первые два часа, приходящиеся в среднем на каждый рабочий день учетного периода, в двойном — за остальные часы сверхурочной работы. Руководители подразделений обязаны обеспечить точный учет сверхурочных работ, выполняемых работниками сверх определенных графиками, и не допускать сверхурочные работы свыше установленных Трудовым кодексом РФ”.

Обращаем внимание, что в ПВТР обязательно должен быть отражен учетный период. Иначе у работодателя могут возникнуть сложности. Судебная практика. В споре по оплате сверхурочных работ при суммированном учете рабочего времени работодатель не смог доказать, что работник предъявил требования за пределом срока давности. При суммированном учете о нарушении своих прав по оплате сверхурочных работники могли узнать только по истечении учетного периода, потому с этого момента подлежит исчислению срок, установленный ст.

А работодатель не указал в документах сведений о продолжительности учетного периода. Ссылка компании на ведение ежемесячного учета рабочего времени сама по себе не подтверждает, что там был установлен учетный период — месяц апелляционное определение Липецкого областного суда от Трудовым законодательством установлено общее ограничение для размера учетного периода — он не может быть меньше месяца и больше года ч.

Однако для некоторых категорий сотрудников установлены специальные правила. Например, при введении суммированного учета для работников с вредными условиями труда необходимо установить учетный период в три месяца ч. Работодателю необходимо принимать во внимание эти особенности определение Московского городского суда от Согласно ст.

В первом случае компания должна ознакомить с новой редакцией ПВТР всех работников под подпись. Во втором случае с приказом, вносящим изменения дополнения в ПВТР, знакомятся только те работники, которых эти изменения дополнения непосредственно затрагивают.

После того как возможность работы по графику и суммированный учет для отдельных категорий работников прописаны в ПВТР, компания может ввести новые положения для конкретных работников.

Так как при этом придется изменять их трудовые договоры вносить условия о работе по графику с суммированным учетом рабочего времени , то у работодателя есть риск столкнуться с их несогласием на подобные изменения. По общему правилу, любые изменения трудового договора возможны по соглашению сторон трудового договора ст. Поэтому если работники согласны с тем, что будут работать по графику и у них будет суммированный учет рабочего времени, то можно подписать приказ и заключить дополнительные соглашения, предусмотрев срок вступления в силу значительно раньше, чем два месяца, которые положены по ст.

Если работники не согласны с подобными нововведениями, то работодатель может изменить условия трудового договора только при наличии оснований и по процедуре, установленной в ст. Поэтому если есть вероятность того, что работники не согласятся с введением работы по графику, лучше инициировать процедуру изменения определенных сторонами условий трудового договора по причине изменения организационных или технологических условий труда согласно ст.

О дополнительных выплатах при увольнении по соглашению сторон читайте подробнее в статье “Как защититься от незаконных требований сотрудников” на стр. Подробнее о том, как изменить режим рабочего времени в зависимости от того, каким образом он был установлен в компании, читайте в статье “Меняем режим рабочего времени” на стр.

Обратите внимание: в приказе о введении суммированного учета рабочего времени следует отразить, какие организационные или технологические изменения повлекли изменения условий трудового договора и как именно эти изменения будут проходить см.

О введении работы по графику с суммированным учетом рабочего времени для отдельных категорий работников. В связи с увеличением объема работы по причине открытия станций метрополитена рядом с магазинами ООО “Дефис” и для обеспечения бесперебойного обслуживания покупателей, руководствуясь ст. Отменить действующий режим рабочего времени для работников, занимающих должности и работающих по профессии согласно приложению к настоящему приказу.

Установить новый режим рабочего времени для работников, занимающих должности и работающих по профессии согласно приложению к настоящему приказу, с до Ввести режим труда и отдыха согласно графикам работы, утверждаемым для работников, занимающих должности и работающих по профессии согласно приложению к настоящему приказу. Ввести суммированный учет рабочего времени для работников, занимающих должности и работающих по профессии согласно приложению к настоящему приказу.

Установить учетный период для суммированного учета — три месяца. Директоров магазинов Кимерова П. Директорам магазинов Кимерову П. Главному бухгалтеру Парьевой М. Начальнику отдела кадров Зиновьевой А. Настоящий приказ вступает в силу: 9. Приложение: Перечень должностей и профессий работников, которым установлен режим работы по графику с суммированным учетом рабочего времени.

Форма уведомления законодательством не предусмотрена можно воспользоваться образцом, приведенным в Примере 3. Пример 3. Уведомление об изменении определенных сторонами условий трудового договора. Приказом от В связи с этим определенные сторонами условия трудового договора от Устанавливается режим рабочего времени согласно графику работы, утверждаемому работодателем, с суммированным учетом рабочего времени. Учетный период — 3 месяца. Продолжительность рабочего дня смены составляет 12 часов.

Время начала работы и время окончания работы, выходные дни устанавливаются графиками работы. Указанные изменения не затрагивают Вашу трудовую функцию. Одновременно сообщаем, что в случае отказа от работы в новых условиях Вам будут предложены вакансии, соответствующие Вашей квалификации, а также нижестоящие при их наличии.

Суммированный учет рабочего времени от а до я

Оптимальное использование мощностей предприятия требует в ряде случаев ввод сменного режима труда. Дорогие читатели! Статья рассказывает о типовых способах решения юридических вопросов, но каждый случай индивидуален.

Новости Инструменты Форум Барометр. Войти Зарегистрироваться.

Переход предприятия на суммированный учёт рабочего времени обязательно должен быть оправдан производственной необходимостью. Произвольное введение такой формы учёта не допустимо. Продолжительность рабочего времени, определена Трудовым кодексом. В России базовой величиной выступает восьмичасовой рабочий день.

Трудовой договор (суммированный учет рабочего времени)

Если в компании сотрудники трудятся более 8 часов в день, то без суммированного учета рабочего времени работодателю не обойтись. Ведь именно этот способ учета позволяет контролировать, соблюдается ли норма рабочего времени, имеются ли у работников часы сверхурочной работы и сколько именно. ТК РФ устанавливает нормы рабочего времени: не более 8 часов в день и 40 часов в неделю. Действительно, в некоторых компаниях работники приходят на работу утром в 9. Однако реальная жизнь нередко отклоняется от нормы, в том числе и в отношении рабочего времени. Некоторые из таких отклонений описаны в ТК РФ, в частности, в ст. Например, фрезеровщики на заводе с непрерывными процессами всего производства работают в три смены в сутки, сменяя друг друга сменная работа , или продавцы в магазине трудятся по 12 часов два дня, а потом два дня отдыхают работа по графику — это как раз повод ввести суммированный учет. В таких случаях сотрудники работают по специально разработанному графику и для расчета их рабочего времени вводится суммированный учет.

Суммированный учет рабочего времени в 2019 году

Суммированный учет рабочего времени — это мера, применяемая, когда специфика деятельности компании исключает возможность ведения стандартного учета. Рассмотрим в статье особенности, расскажем, как правильно вести и оформлять документы. Суммированно учитывать трудозатраты работников необходимо в случае, если по организационным или производственным причинам на предприятии не соблюдается суточная или недельная норма трудовых часов. К примеру, продолжительность трудовых смен водителей определяется множеством факторов и зачастую не может быть принята заранее.

Срок испытания при приеме на работу составляет [указать срок]. В связи со спецификой деятельности Работнику устанавливается суммированный учет рабочего времени.

.

Суммированный учет рабочего времени в трудовом договоре: образец

.

ПОСМОТРИТЕ ВИДЕО ПО ТЕМЕ: Как оформить приказ на ежегодный отпуск (форма Т-6, Т-6а) – Елена А. Пономарева

.

Вводим суммированный учет рабочего времени

.

Применение суммированного учета рабочего времени рабочего времени на практике трудового договора о переходе на суммированный учет рабочего периода при суммированном учете рабочего времени – календарный год. суммированный учет рабочего времени с учетным периодом 1 месяц.

.

.

.

.

.

.

Иллюстрированный самоучитель по бухгалтерскому учету › Расчет заработной платы кадрам › Суммированный учет рабочего времени. Примеры расчета. [страница – 30] | Самоучители по бухгалтерским программам

Суммированный учет рабочего времени. Примеры расчета.

Что такое суммированный учет рабочего времени?

Этот способ учета рабочего времени вводится в тех организациях, где работодатель объективно не имеет возможности организовать процесс труда так, чтобы соблюдалась ежедневная или еженедельная норма рабочего времени. Как правило, это непрерывно действующие организации, в которых работники трудятся посменно (в две, три или четыре смены). Количество отработанных работником часов за один рабочий день (смену) больше 8 часов, а в неделю может составлять больше 40 часов. Для соблюдения прав таких категорий работников закон предусматривает введение суммированного учета рабочего времени.

Например, для медицинских работников, как работающих во вредных условиях труда, установлена сокращенная продолжительность рабочего времени – не более 39 часов в неделю. Но врачи, как правило, дежурят сутками. И если у врача на неделе выпало два дежурства, он уже превысил установленную для него недельную норму рабочего времени.

В подобных ситуациях работодатель вводит суммированный учет рабочего времени, который предполагает, что продолжительность рабочего времени конкретного работника будет учитываться не за день (смену) или неделю, а за иной более длительный учетный период.

Следовательно, сверхурочной работой при суммированном учете рабочего времени будут те часы, которые работник отработает сверх нормального числа рабочих часов за учетный период.

В большинстве случаев при суммированном учете рабочего времени сверхурочная работа изначально заложена в графике сменности работника. Работник, например, может взять график на ноябрь 2008 года, и подсчитать, что в ноябре 2008 года ему придется фактически отработать по графику 184 часа. Это количество рабочих часов превышает допустимую норму рабочих часов в ноябре (151 час), следовательно, 33 сверхурочных часа работы изначально уже заложены в графике работы.

Конечно, при суммированном учете рабочего времени работодатель может так распланировать смены работника, что за учетный период у него не будет превышения нормального числа рабочих часов. Но это опять-таки не исключает возможности привлечения работника к сверхурочной работе. Например, в ситуации, когда один работник вынужден был остаться после завершения своей смены, чтобы дождаться сменяющего его работника.

Что такое учетный период?

Учетный период – это период времени, который может равняться месяцу, кварталу или другому периоду, но не может быть больше одного года. Именно за этот период времени работник должен отработать нормальное число рабочих часов, а если фактически работник отработал больше, то это, скорее всего, будет сверхурочная работа.

Особенности применения суммированного учета рабочего времени

Сергей Большаков, магистр экономических наук

На практике суммированный учет рабочего времени применяют в организациях с непрерывным производственным (технологическим) процессом (металлургическое, химическое производство и т.п.), в организациях, осуществляющих непрерывное обслуживание населения (связь, здравоохранение, энергетика, торговля и др.), на транспорте (железнодорожном, автомобильном), на сезонных производствах, при вахтовом методе организации работ и др.

 


Суммированный учет рабочего времени вводят в организациях, где по условиям производства (работы) невозможно или экономически нецелесообразно ежедневно или еженедельно применять нормы продолжительности рабочего времени, установленные ст. 112–114 Трудового кодекса РБ (далее – ТК) (ст. 126 ТК).


Особенности введения суммированного учета рабочего времени


Суммированный учет можно вводить как для работников со сменным режимом работы, так и для тех, кому графиком работ продолжительность рабочего дня установлена более 8 ч и соответственно предоставляется более 2 дней отдыха в неделю.

 

От редакции:
Суммированный учет рабочего времени вводят приказом. Установленный режим рабочего времени необходимо довести до ведома работников не позднее 1 месяца до введения его в действие (часть шестая ст. 123 ТК).

 

Решение о введении суммированного учета принимает наниматель по согласованию с профсоюзом (при его наличии). Одновременно с принятием такого решения устанавливают продолжительность учетного периода (месяц, квартал, полугодие, год). Определение конкретного периода очень важно для обеспечения правильного учета рабочего времени и расчетов по заработной плате, в т.ч. оплаты сверхурочных работ.


Образец приказа о введении суммированного учета рабочего времени смотрите в рубрике «Полезная документация» на с. 25 журнала.


В течение учетного периода продолжительность рабочего времени, предусмотренная ст. 112–114 ТК, у работника может быть в одни дни (недели) больше, а в другие меньше по сравнению с недельной нормой. При этом ежедневная продолжительность рабочего времени не может превышать 12 ч.


Суммированный учет рабочего времени и вредные условия труда


ЭТО ВАЖНО! В организациях при применении суммированного учета рабочего времени для работников, занятых на работах с вредными и (или) опасными условиями труда, установленную для них максимально допустимую продолжительность ежедневной работы (смены) при 35-часовой рабочей неделе не более 7 ч соблюдайте в среднем за учетный период.


График работ при суммированном учете рабочего времени


При составлении графика работ (сменности) также должна быть соблюдена минимальная продолжительность (42 ч) еженедельного непрерывного отдыха, которую при суммированном учете рабочего времени исчисляют в среднем за учетный период, принятый в организации.


Графики работ (сменности) необходимо составлять таким образом, чтобы рабочее время по графику в целом за учетный период соответствовало расчетной норме рабочего времени, определенной для этого же периода в соответствии с нормами ст. 112–117 ТК и зависящей от установленного в организации режима работы.


Пример


В организации установлена 5-дневная рабочая неделя с выходными днями в субботу и воскресенье с нормальной продолжительностью рабочего времени 40 ч в неделю. На одном производственном участке для рабочих введен суммированный учет рабочего времени с учетным периодом квартал. Расчетная норма III квартала 2011 г. составляет 528 ч, в т.ч. в июле – 168 ч, августе – 184 ч, сентябре – 176 ч. Для рабочих производственного участка планируемое рабочее время по графику должно быть равно расчетной норме в целом за III квартал. Таким образом, графиком работ может быть предусмотрено: в июле – 170 ч, августе – 170 ч, сентябре – 188 ч, что в сумме составит 528 ч.

 

Рабочее время в июле, запланированное графиком работ в примере, которое на 2 ч выше июльской нормы, рассчитанной в соответствии с постановлением Минтруда и соцзащиты РБ от 01.10.2010 № 135, не будет сверхурочным, поскольку для работников, которым установлен суммированный учет рабочего времени, сверхурочной считается работа за пределами нормы рабочего времени соответствующего учетного периода (в данном случае – квартала).


Таким образом, если работник фактически отработает в III квартале 535 ч (расчетная норма – 528 ч), то 7 ч переработки сверх нормы часов учетного периода и графика считаются часами сверхурочной работы, компенсацию за которые производят в соответствии с нормами ст. 69 ТК.


ЭТО ВАЖНО! Планировать сверхурочную работу в графиках работ (сменности) недопустимо.


Законодательство допускает использование для работы не более 12 выходных дней в году (ст. 144 ТК).


Сверхурочные работы не должны превышать для каждого работника 4 ч в течение 2 дней подряд и 120 ч в год (ст. 122 ТК).


Если работа в праздничный день выполняется сверх месячной нормы рабочего времени, то кроме оплаты в повышенном размере работнику по его желанию предоставляют другой неоплачиваемый день отдыха (ст. 148 ТК).


При определении расчетной нормы рабочего времени из числа календарных дней исключают выходные дни по календарю 5-дневной (суббота и воскресенье) или 6-дневной (воскресенье) рабочей недели, а также дни государственных праздников и праздничных дней, которые объявлены нерабочими днями. Также необходимо учитывать, что продолжительность работы накануне праздничных дней сокращается на 1 ч (ст. 116 ТК).


Например, при полной 40-часовой норме продолжительности рабочего времени в неделю (ст. 112 ТК) для 5-дневной рабочей недели с выходными днями в воскресенье и понедельник расчетную норму рабочего времени определяют путем умножения 8 ч (40 / 5) на число рабочих дней учетного периода. Так, расчетная норма рабочего времени в январе 2011 г. равна 160 ч (8 ч ґ 20 дней). Из полученного результата вычитают в соответствии со ст. 116 ТК 1 предпраздничный час (перед 7 января). Итак, расчетная норма рабочего времени января равна 159 ч.


При суммированном учете рабочего времени ежемесячное количество часов рабочего времени учетного периода конкретного работника согласно графику работы (сменности) будет отличаться от ежемесячной расчетной нормы рабочего времени, рассчитанной в вышеуказанном порядке. При этом будет различной его ежедневная и еженедельная продолжительность рабочего времени.


Расчетная норма часов при увольнении


При увольнении работника в период действия учетного периода расчетной нормой часов его рабочего времени будет являться количество часов, рассчитанных с начала учетного периода до дня увольнения в соответствии с постановлением Минтруда РБ от 18.10.1999 № 133 «Об установлении расчетной нормы рабочего времени на 2000 год и утверждении Разъяснения о порядке определения расчетной нормы рабочего времени и часовой тарифной ставки в Республике Беларусь».


Определение количества часов сверхурочной работы производят путем вычитания из фактически отработанных им часов (согласно табелю учета рабочего времени) расчетной нормы часов, установленной для работника.


При окончательном расчете заработной платы работника в случае превышения фактически отработанных часов над расчетной нормой часов за указанный период наниматель производит оплату за работу в сверхурочное время в порядке, определенном ст. 69 ТК. Если фактически отработанные часы меньше расчетной нормы часов, оплату производят за фактически отработанное время.


Если работник в течение учетного периода по уважительным причинам не работал, расчетная норма рабочего времени подлежит уточнению (пересмотру) по отношению к нему в соответствии с постановлением Минтруда и соцзащиты РБ от 01.10.2010 № 135 «Об установлении расчетной нормы рабочего времени на 2011 год».


Работникам с суммированным учетом рабочего времени, которые увольняются до окончания учетного периода, дата увольнения с их согласия может указываться с учетом дней, полагающихся для отдыха в связи с работой сверх установленной продолжительности рабочего времени, или рабочих дней для исключения недоработки расчетной нормы рабочего времени.


 

Статистика

: Сила от данных! Аналитическое построение графика: совокупная частота

Архивный контент

Информация, помеченная как архивная, предназначена для справочных, исследовательских или учетных целей. Он не регулируется веб-стандартами правительства Канады и не изменялся и не обновлялся с момента его архивирования. Свяжитесь с нами, чтобы запросить формат, отличный от доступных.

Совокупная частота используется для определения количества наблюдений, которые лежат выше (или ниже) определенного значения в наборе данных.Совокупная частота рассчитывается с использованием таблицы распределения частот, которую можно построить на основе графиков стебля и листа или непосредственно на основе данных.

Накопленная частота вычисляется путем добавления каждой частоты из таблицы распределения частот к сумме ее предшественников. Последнее значение всегда будет равно сумме для всех наблюдений, поскольку все частоты уже были добавлены к предыдущей сумме.

Дискретные или непрерывные переменные

Переменные в любом вычислении можно охарактеризовать присвоенным им значением.Дискретная переменная состоит из отдельных неделимых категорий. Между переменной и ее соседом не может существовать никаких значений. Например, если вы наблюдаете за ежедневной посещаемостью класса, вы можете обнаружить, что в классе 29 учеников в один день и 30 учеников в другой. Тем не менее, посещаемость студентов не может быть между 29 и 30. (Здесь просто нет места, чтобы наблюдать какие-либо значения между этими двумя значениями, поскольку нет возможности иметь 29 с половиной студентов.)

Не все переменные характеризуются как дискретные. Некоторые переменные (например, время, рост и вес) не ограничиваются фиксированным набором неделимых категорий. Эти переменные называются непрерывными переменными , и они делятся на бесконечное количество возможных значений. Например, время можно измерять дробными частями часов, минут, секунд и миллисекунд. Таким образом, вместо того, чтобы финишировать за 11 или 12 минут, жокей и его лошадь могут пересечь финишную черту за 11 минут 43 секунды.

Важно знать разницу между двумя типами переменных, чтобы правильно рассчитать их совокупную частоту.


Начало страницы

Пример 1 – Дискретные переменные

Общее количество скалолазов на озере Луиз, Альберта, было зарегистрировано за 30-дневный период. Результаты следующие:

31, 49, 19, 62, 24, 45, 23, 51, 55, 60, 40, 35 54, 26, 57, 37, 43, 65, 18, 41, 50, 56, 4, 54, 39, 52, 35, 51, 63, 42.

  1. Используйте эти дискретные переменные, чтобы:
    • создайте график стебля и листа (см. Раздел о графиках стебля и листа) с дополнительными столбцами, обозначенными Частота, Верхнее значение и Суммарная частота
    • вычислить частоту наблюдений для каждого ствола
    • найдите верхнее значение для каждого стержня
    • вычислить совокупную частоту, сложив числа в столбце Частота
    • записать все результаты в график
  2. Постройте график, используя ось Y (или вертикальную линию) для совокупной частоты и ось X (или горизонтальную линию) для количества людей, занимающихся скалолазанием.
Ответы:
  1. Число скалолазов колеблется от 4 до 65. Для построения графика ствола и листа данные лучше всего сгруппировать в интервалы классов по 10.

    Каждый интервал может быть расположен в столбце Stem . Цифры в этом столбце представляют собой первое число в интервале классов. (Например, стержень 0 представляет интервал 0–9, стержень 1 представляет интервал 10–19 и т. Д.)

    В столбце Leaf указано количество наблюдений, которые лежат в пределах каждого интервала класса.Например, в Stem 2 (интервал 20–29) три наблюдения, 23, 24 и 26, представлены как 3, 4 и 6.

    В столбце Частота указано количество наблюдений, найденных в интервале классов. Например, в Stem 5 было найдено девять листьев (или наблюдений); в Stem 1 их всего два.

    Используйте столбец Частота для вычисления совокупной частоты.

    • Сначала добавьте число из столбца Frequency к его предшественнику.Например, в Stem 0 у нас есть только одно наблюдение и нет предшественников. Суммарная частота равна единице.

      1 + 0 = 1

    • Однако в Stem 1 есть два наблюдения. Добавьте эти два к предыдущей совокупной частоте (один), и результат – три.

      1 + 2 = 3

    • В Stem 2 есть три наблюдения. Добавьте эти три к предыдущей совокупной частоте (три), и общая (шесть) будет совокупная частота для Stem 2.

      3 + 3 = 6

    • Продолжайте эти вычисления, пока не сложите все числа в столбце Частота .
    • Запишите результаты в столбец Суммарная частота .

    В столбце Верхнее значение перечислено наблюдение (переменная) с наивысшим значением в каждом из интервалов классов. Например, в Stem 1 два наблюдения 8 и 9 представляют переменные 18 и 19. Верхнее значение этих двух переменных равно 19.

    Таблица 1. Суммарная частота ежедневных учетов скалолазов, зарегистрированных в озере Луиз, Альберта, 30-дневный период.
    0 4 1 4 1
    1 8 9 2 19 1 + 2 = 3
    2 3 4 6 3 26 3 + 3 = 6
    3 1 5 5 7 9 5 39 6 + 5 = 11
    4 0 1 2 3 5 9 6 49 11 + 6 = 17
    5 0 1 1 2 4 4 5 6 7 9 57 17 + 9 = 26
    6 0 2 3 5 4 65 26 + 4 = 30
  2. Поскольку эти переменные дискретны, используйте верхние значения при построении графика.Постройте точки, чтобы сформировать непрерывную кривую, называемую ожив.

    Всегда помечайте график кумулятивной частотой, соответствующей количеству выполненных наблюдений, на вертикальной оси. Обозначьте горизонтальную ось другой переменной (в данном случае общим количеством скалолазов), как показано ниже:

Следующая информация может быть получена из графика или таблицы:

  • 11 из 30 дней 39 человек или меньше поднялись на скалы вокруг озера Луиза
  • за 13 из 30 дней 50 или более человек поднялись на скалы вокруг озера Луиза

Когда используется непрерывная переменная, как вычисление совокупной частоты, так и построение графика требуют подхода, несколько отличного от подхода, используемого для дискретной переменной.


Начало страницы

Пример 2 – Непрерывные переменные

В течение 25 дней высота снежного покрова на горе Уистлер, Британская Колумбия. было измерено (с точностью до сантиметра) и записано следующим образом:

242, 228, 217, 209, 253, 239, 266, 242, 251, 240, 223, 219, 246, 260, 258, 225, 234, 230, 249, 245, 254, 243, 235, 231, 257

  1. Используйте указанные выше непрерывные переменные, чтобы:
    • настроить таблицу распределения частот
    • найти частоту для каждого интервала классов
    • найти конечную точку для каждого интервала классов
    • вычислить совокупную частоту, сложив числа в столбце Частота
    • записать все результаты в таблицу
  2. Используйте информацию, полученную из таблицы распределения частот, чтобы построить график совокупной частоты.
Ответы:
  1. Высота снежного покрова составляет от 209 см до 266 см. Для составления таблицы частотного распределения данные лучше всего сгруппировать по интервалам классов по 10 см каждый.

    В столбце Высота снежного покрова указан каждый 10-сантиметровый интервал классов от 200 до 270 см.

    В столбце Частота записывается количество наблюдений, попадающих в определенный интервал. В этом столбце представлены наблюдения в столбце Tally , только в числовой форме.

    Столбец Endpoint работает так же, как столбец Upper value в упражнении 1, за исключением того, что конечная точка является самым большим числом в интервале, независимо от фактического значения каждого наблюдения. Например, в интервале классов 210–220 фактическое значение двух наблюдений составляет 217 и 219. Но вместо 219 используется конечная точка 220.

    В столбце Суммарная частота отображается сумма каждой частоты, добавленной к предыдущей.

  2. Поскольку переменная является непрерывной, при построении графика используются конечные точки каждого интервала классов. Нанесенные точки соединяются, образуя ожив.

    Помните, кумулятивная частота (количество выполненных наблюдений) помечена на вертикальной оси y, а любая другая переменная (высота снежного покрова) помечена на горизонтальной оси x, как показано на рисунке 2.

Следующая информация может быть получена из графика или таблицы:

  • Ни один из 25 дней не имел глубины снега менее 200 см
  • Один из 25 дней снега имел глубину менее 210 см
  • Два из 25 дней снега имел глубину 260 см и более

Начало страницы

Другой расчет, который можно получить с помощью таблицы частотного распределения, – это относительное частотное распределение .Этот метод определяется как процент наблюдений, попадающих в каждый интервал класса. Относительную совокупную частоту можно найти, разделив частоту каждого интервала на общее количество наблюдений. (Дополнительные сведения см. В разделе «Распределение частот» в главе «Организация данных».)

Таблица распределения частот также может использоваться для вычисления кумулятивного процента . Этот метод распределения частот дает нам процент совокупной частоты, а не процент только частоты.

Статистика

: Сила от данных! Аналитическое построение графика: совокупный процент

Архивный контент

Информация, помеченная как архивная, предназначена для справочных, исследовательских или учетных целей. Он не регулируется веб-стандартами правительства Канады и не изменялся и не обновлялся с момента его архивирования. Свяжитесь с нами, чтобы запросить формат, отличный от доступных.

Совокупный процент – это еще один способ выразить частотное распределение.Он вычисляет процент совокупной частоты в каждом интервале, так же как относительное распределение частоты вычисляет процент частоты.

Основное преимущество совокупного процента перед совокупной частотой как меры частотного распределения состоит в том, что он обеспечивает более простой способ сравнения различных наборов данных.

График совокупной частоты и совокупного процента в точности совпадает, за исключением шкалы по вертикальной оси. Фактически, возможно иметь две вертикальные оси (одна для совокупной частоты, а другая для совокупного процента) на одном графике.

Совокупный процент вычисляется путем деления накопленной частоты на общее количество наблюдений ( n ), а затем умножения на 100 (последнее значение всегда будет равно 100%). Таким образом,

совокупный процент = (совокупная частота ÷ n) x 100

Пример 1 – Расчет совокупного процента

В течение 25 дней высота снежного покрова на горе Уистлер, г. до н. Э. было измерено (с точностью до сантиметра) и записано следующим образом:

242, 228, 217, 209, 253, 239, 266, 242, 251, 240, 223, 219, 246, 260, 258, 225, 234, 230, 249, 245, 254, 243, 235, 231, 257 .

  1. Используйте приведенные выше данные (те же данные, что и в примере 2 предыдущего раздела о совокупной частоте), чтобы:
    • построить другую таблицу распределения частот
    • выяснить, какая частота для каждого интервала
    • узнать конечную точку для каждого интервала
    • вычислить совокупную частоту и процент
    • запись результатов в таблицу
  2. Нарисуйте график с двумя разными вертикальными (y) осями (либо на каждой стороне графика, либо рядом): одна для совокупной частоты и одна для совокупного процента.Обязательно пометьте совокупная частота и совокупный процент с обеих сторон вертикальной оси или оси Y. Обозначьте ось x другой переменной (глубина снежного покрова).

Ответы:

  1. Высота снежного покрова составляет от 209 см до 266 см. Для составления таблицы данные лучше всего сгруппировать по интервалам классов по 10 см каждый.

    В столбце Высота снежного покрова указан каждый 10-сантиметровый интервал классов от 200 до 270 см.

    В столбце Частота записывается количество наблюдений, попадающих в определенный интервал.В этом столбце представлены наблюдения в столбце Tally , только в числовой форме.

    Каждое из чисел в столбце Конечная точка – это наибольшее число в каждом интервале классов. В интервале от 200 см до 210 см конечная точка будет 210.

    В столбце Суммарная частота отображается сумма каждой частоты, добавленной к предыдущей, как показано в упражнениях в предыдущем разделе.

    В столбце Совокупный процент суммарная частота делится на общее количество наблюдений (в данном случае 25).Затем результат умножается на 100. Этот расчет дает совокупный процент для каждого интервала.

  2. За исключением дополнительной оси, представляющей совокупный процент, график должен выглядеть точно так же, как нарисованный в Примере 2 раздела Совокупная частота.

    Ось Накопительный процент разделена на пять интервалов по 20, а ось Накопленная частота разделена на пять интервалов по 5. Ось Высота снежного покрова разделена на конечные точки каждого 10-сантиметрового интервала классов.

    Используя каждую конечную точку для построения графика, вы обнаружите, что и совокупная частота, и совокупный процент попадают в одно и то же место. Например, используя конечную точку 260, нарисуйте свою точку на 23-й день (совокупная частота). Эта точка находится в том же месте, где будет отображаться совокупный процент (92%).

    Вы должны быть очень осторожны при построении графика с двумя осями Y. Например, если у вас 47 наблюдений, у вас может возникнуть соблазн использовать интервалы 5 и завершить ось Y на совокупной частоте 50.Однако, когда вы рисуете ось Y для кумулятивного процента, вы должны установить интервал 100% на том же уровне, что и отметка 47 на другой оси Y, а не на отметке 50. В этом примере совокупная частота 47 представляет 100% ваших данных. Если вы поместите 100% вверху шкалы, где отмечен интервал 50, ваша линия совокупной частоты не будет соответствовать строке совокупного процента.

    Построенные точки соединяются, образуя ожив, который часто выглядит как растянутый S .Ogives используются для определения количества или процента наблюдений, которые лежат выше или ниже указанного значения. Например, согласно таблице и графику, в 92% случаев высота снежного покрова, зарегистрированная за 25-дневный период, была ниже отметки 260 см.

Следующая информация может быть получена из графика или таблицы:

  • в течение 25-дневного периода, в 24% случаев зарегистрированная высота снежного покрова была менее 230 см
  • на 7 дней из 25, высота снежного покрова не менее 250 см

Как читать график совокупной частоты

Во время вспышки заболевания, такого как пандемия коронавируса (COVID-19), средства массовой информации показывают ежедневные графики, отражающие распространение болезни.Следующие два графика появляются часто:

  • Новые дела на каждый день (или неделю). Эта информация обычно отображается в виде гистограммы или игольчатого графика. График иногда называют графиком частот .
  • общее число дел, отложенных на графике времени. Обычно этот график представляет собой линейный график. График иногда называют графиком накопленной частоты .

Пример каждого графика показан выше.Эти два графика связаны и фактически содержат одну и ту же информацию. Однако график совокупной частоты менее знаком и труднее интерпретировать. В этой статье рассказывается, как читать график совокупной частоты. Форма кумулятивной кривой показывает, увеличивается ли ежедневное количество случаев заболевания, уменьшается или остается неизменным.

Для этой статьи я создал пять примеров, показывающих распространение гипотетического заболевания. Цифры, используемые в этой статье, не отражают какое-либо конкретное заболевание или вспышку.

Как читать график накопленной частоты

Когда исходная величина неотрицательна (как для новых случаев заболевания), кумулятивная кривая никогда не уменьшается. Он либо увеличивается (когда сообщается о новых случаях), либо остается неизменным (если новых случаев не сообщается).

Когда базовое количество (новые случаи) является подсчетом, кумулятивная кривая технически является ступенчатой ​​функцией, но обычно она отображается как непрерывная кривая, соединяя кумулятивную сумму за каждый день.Накопленная кривая за много дней (более 40) часто выглядит гладкой, поэтому вы можете описать ее форму, используя следующие описательные термины:

  • Когда количество новых случаев увеличивается, кумулятивная кривая «вогнута вверх». Обычно вогнутая кривая имеет U-образную форму, например: ∪. Поскольку кривая накопленной частоты не убывает, она выглядит как правая сторона символа.
  • Когда количество новых случаев остается неизменным, кумулятивная кривая является линейной.Наклон кривой указывает количество новых случаев.
  • Когда количество новых случаев уменьшается, кумулятивная кривая «вогнута вниз». В общем, вогнутая кривая выглядит как перевернутая буква U, например: ∩. Поскольку кривая накопленной частоты не убывает, вогнутая кривая выглядит как левая сторона символа.

Типичная кумулятивная кривая имеет S-образную форму, как показано справа. Начальная часть кривой (красная область) вогнута вверх, что указывает на рост числа новых случаев.Кумулятивная кривая почти линейна между 35-м и 68-м днями (желтая область), что указывает на то, что количество новых случаев каждый день приблизительно постоянно. После 68-го дня кумулятивная кривая вогнута вниз, что указывает на то, что количество ежедневных случаев уменьшается. Каждый интервал может быть коротким, длинным или отсутствовать.

Кумулятивная кривая выглядит плоской около дня 100. Если кумулятивная кривая строго горизонтальна (нулевой наклон), это означает, что новых случаев нет.

Иногда вы можете увидеть связанный график, который отображает логарифм кумулятивных наблюдений. Ближе к концу этой статьи я кратко обсуждаю, как интерпретировать график в логарифмическом масштабе.

Примеры частотных графиков

Полезно посмотреть на форму кривой совокупной частоты для пяти различных гипотетических сценариев. В этом разделе показаны графики частоты обращений за день; кривые накопленной частоты показаны в последующих разделах.

В каждом сценарии население переживает в общей сложности 1000 случаев заболевания в течение 100-дневного периода. Для обсуждения предположим, что система здравоохранения может лечить до 20 новых случаев в день. Графики справа показывают, что одни сценарии перегрузят систему здравоохранения, а другие – нет. Пять сценариев:

  • Постоянная частота новых обращений: На верхнем графике сообщество получает около 10 новых обращений в день в течение каждого из 100 дней.Поскольку количество случаев в день невелико, система здравоохранения может лечить все инфицированные.
  • Ранний пик: На втором графике количество новых случаев быстро растет в течение 10 дней, а затем постепенно снижается в течение следующих 50 дней. Поскольку в дни 5–25 развивается более 20 новых случаев, система здравоохранения в эти дни перегружена.
  • Отложенный пик: На третьем графике количество новых случаев постепенно возрастает, выравнивается и постепенно снижается.Есть всего несколько дней, в которые количество новых случаев превышает возможности системы здравоохранения. Эпидемиологи называют этот сценарий «сглаживанием кривой» предыдущего сценария. Соблюдая правила гигиены и избегая социальных взаимодействий, сообщество может замедлить распространение болезни.
  • Вторичная вспышка: На четвертом графике первая вспышка, по сути, разрешается, когда появляется вторая вспышка. Это может произойти, например, если новый инфицированный человек войдет в сообщество после окончания первой вспышки.Чтобы предотвратить этот сценарий, чиновники здравоохранения могут наложить запреты на поездки для определенных сообществ.
  • Экспоненциальный рост: На пятом графике количество новых дел увеличивается в геометрической прогрессии. Система здравоохранения в конечном итоге перегружена, и график не показывает, когда может закончиться распространение болезни.

Графики в этом разделе представляют собой графики частоты. В следующих разделах показан и интерпретирован график совокупной частоты для каждого сценария.

Постоянное количество новых дел

В первом сценарии новые случаи появляются с постоянной скоростью. Как следствие, диаграмма совокупной частоты выглядит как прямая линия. Наклон линии – это скорость появления новых случаев. Например, в этом сценарии количество новых случаев ежедневно составляет приблизительно 10. Следовательно, кумулятивная кривая имеет средний наклон («рост за пробег»), близкий к 10.

Ранний пик

Во втором сценарии новые случаи сначала появляются очень быстро, а затем постепенно сокращаются.Следовательно, первая часть совокупной кривой вогнута вверх, а вторая часть вогнута вниз. В этом сценарии количество новых случаев сокращается до нуля, на что указывает почти горизонтальная кумулятивная кривая.

В любой момент времени вы можете использовать наклон кумулятивной кривой, чтобы оценить количество новых случаев, возникающих в этот момент. Дни, когда наклон кумулятивной кривой большой (например, День 10), соответствуют дням, когда регистрируется много новых случаев.Если кумулятивная кривая горизонтальна (нулевой наклон, например, после 60-го дня), новых случаев очень мало.

Отложенный пик

В третьем сценарии новые случаи появляются постепенно, выравниваются, а затем уменьшаются. Это отражено на кумулятивной кривой. Изначально кумулятивная кривая вогнута вверх. Затем он распрямляется и выглядит линейным в течение 10–15 дней. Наконец, он становится вогнутым вниз, что указывает на тенденцию к снижению количества новых случаев. Ближе к концу 100-дневного периода кумулятивная кривая почти горизонтальна, поскольку регистрируется очень мало новых случаев.

Вторичная вспышка

В четвертом сценарии – две вспышки. Во время первой вспышки кумулятивная кривая вогнута вверх или вниз по мере увеличения или уменьшения числа новых случаев соответственно. Кумулятивная кривая почти горизонтальна около 50-го дня, но затем проходит через меньший вогнутый цикл вверх / вниз по мере появления второй вспышки. Ближе к концу 100-дневного периода кумулятивная кривая снова становится почти горизонтальной, когда заканчивается вторая волна.

Экспоненциальный рост

Пятый сценарий демонстрирует экспоненциальный рост. Первоначально количество новых случаев увеличивается очень постепенно, на что указывает небольшой наклон кривой совокупной частоты. Однако между 60–70 днями количество новых случаев начинает резко возрастать. И нижняя, и верхняя кривые растут с экспоненциальной скоростью, но масштаб вертикальной оси для кумулятивной кривой (верхний график) намного больше, чем для графика новых случаев (нижний график).Этот тип роста более вероятен среди населения, которое не использует карантин и «социальное дистанцирование» для уменьшения распространения новых случаев.

Этот последний пример демонстрирует, почему важно маркировать вертикальную ось. На первый взгляд верхний и нижний графики очень похожи. Оба демонстрируют экспоненциальный рост. Один из способов отличить их – помнить, что график совокупной частоты никогда не уменьшается. Напротив, если вы внимательно посмотрите на нижний график, вы увидите, что некоторые столбцы (дни 71 и 91) короче столбцов предыдущего дня.

Будьте осторожны с осями логарифмической шкалы

Предыдущий анализ предполагает, что вертикальная ось откладывает кумулятивные подсчеты в линейном масштабе. В научных статьях может отображаться логарифм общего числа. График имеет логарифмическую шкалу, если на вертикальной оси указано «логарифмическая шкала» или если значения деления представляют собой степени 10, такие как 10, 100, 1000 и т. Д. Если на графике используется логарифмическая шкала:

  • Прямая линия указывает на экспоненциальный рост числа новых случаев.Наклон линии показывает, насколько быстро случаи удвоения, а крутые линии указывают на короткое время удвоения.
  • Вогнутая кривая вниз указывает на то, что количество новых случаев увеличивается меньше, чем экспоненциально. Графики в логарифмической шкале затрудняют различие между медленно увеличивающейся скоростью и уменьшающейся скоростью.

Поскольку очень много графиков, связанных с COVD, используют ось логарифмической шкалы, я написал вторую статью, в которой показано, как «время удвоения» связано с наклоном графика на оси логарифмической шкалы.

Сводка

Таким образом, в этой статье показано, как интерпретировать график совокупной частоты. График совокупной частоты представлен для пяти сценариев, описывающих распространение гипотетического заболевания. В каждом сценарии форма графика совокупной частоты показывает, как распространяется болезнь:

  • Когда кумулятивная кривая составляет , вогнутая вверх , количество новых случаев составляет , увеличиваясь на .
  • Когда кумулятивная кривая имеет вид , линейный , количество новых наблюдений составляет , не изменяясь .
  • Когда кумулятивная кривая составляет , вогнутую вниз , количество новых случаев составляет , уменьшаясь на .
  • Когда кумулятивная кривая горизонтальна , новых случаев не сообщается .

Хотя приложение в этой статье является распространением фиктивной болезни, идеи применяются широко. Каждый раз, когда вы видите график совокупного количества (продажи, произведенные единицы, количество дорожно-транспортных происшествий ,…), вы можете идеи из этой статьи, чтобы интерпретируйте график совокупной частоты и используйте его форму, чтобы вывести тенденции изменения базового количества. Статистики используют эти идеи, чтобы связать кумулятивную функцию распределения (CDF) для непрерывной случайной величины с ее функция плотности вероятности (PDF).

Диаграмма совокупного потока

для обеспечения максимальной стабильности процесса

Часто ли вы не соблюдаете SLA? Вы сомневаетесь перед тем, как уложиться в сроки? Были ли у вас проблемы с доставкой ценности через предсказуемые промежутки времени? Если ответ на любой из этих вопросов утвердительный, вы определенно выиграете от применения кумулятивной блок-схемы к вашему процессу.

Принятие доски Kanban и визуализация каждого шага вашего процесса – хороший первый шаг, но вы должны понимать, что самой доски и одних карт Kanban далеко не достаточно для достижения стабильного процесса.

К счастью, совокупная блок-схема может быть инструментом в вашем арсенале управления проектами, который склонит чашу весов в вашу пользу.

Что такое кумулятивная диаграмма потока?

Кумулятивная блок-схема (также известная как CFD) – одна из самых продвинутых диаграмм канбан-аналитики и гибкой аналитики.Он обеспечивает краткую визуализацию трех наиболее важных показателей вашего потока:

  • Время цикла
  • Пропускная способность
  • Незавершенное производство

Его основная цель – показать вам, насколько стабилен ваш поток, и помочь вам понять, на чем вам нужно сосредоточиться, чтобы сделать ваш процесс более предсказуемым. Он дает вам количественное и качественное представление о прошлых и существующих проблемах и может визуализировать огромные объемы данных.

Как читать диаграмму совокупного потока

Диаграмма отслеживает общее количество рабочих элементов в столбцах раздела «Выполняется» на вашей канбан-доске каждый день.

Горизонтальная ось CFD представляет собой временной интервал, для которого график отображает данные. Вертикальная ось показывает совокупное количество карточек в рабочем процессе в различные моменты времени.

Полосы разного цвета, которые разделяют участки восходящего потока, представляют собой разные этапы вашего рабочего процесса, поскольку они отображаются на самой доске Канбан. Полосы всегда идут вверх или в сторону в зависимости от количества заданий, которые вы выполняете.

Верхняя строка каждой полосы на совокупной блок-схеме представляет собой точку входа для задач на соответствующем этапе вашей Канбан-доски, а нижняя линия показывает, когда она покидает ее. Если линия становится плоской, на соответствующий этап ничего не поступает или ничего не выходит из нее.

Используя CFD, вы можете получить представление о том, как долго длится примерное время цикла ваших задач.

Это возможно путем измерения расстояния по горизонтали между верхней линией первой стадии на диаграмме совокупного потока и нижней линией последней «незавершенной» стадии.

Количество прошедших дней / недель / месяцев – это приблизительное среднее время цикла заданий вашей команды за данный период времени.

Расстояние между линиями CFD покажет вам проблемы вашего рабочего процесса.

Понимание данных на графике CFD

Вы можете определить, является ли ваш процесс стабильным, с первого взгляда, посмотрев, как продвигаются верхняя и нижняя строки каждой полосы на вашей совокупной диаграмме потока.

Есть три распространенных сценария:

Группы развиваются параллельно

Это означает, что ваша пропускная способность стабильна, и новые задачи входят в ваш рабочий процесс параллельно с теми, которые выходят из него. Это идеальный результат, который показывает, что вы можете сосредоточить свои усилия на сокращении времени цикла выполнения заданий.

Полоса быстро сужается

Если полоса на вашем CFD постоянно сужается, это означает, что пропускная способность этапа, который он представляет, выше, чем скорость входа.Это признак того, что на данном этапе у вас больше емкости, чем вам действительно нужно, и вам следует переместить ее, чтобы оптимизировать поток.

Полоса быстро расширяется

Каждый раз, когда это происходит на кумулятивной блок-схеме, количество карточек, попадающих на соответствующую стадию на доске Канбан, больше, чем количество назначений, покидающих ее. Это распространенная проблема, вызванная многозадачностью и другими видами бесполезной деятельности, не приносящей ценности.

Есть много возможных действий для решения этой проблемы.Однако, если это не вызвано зависимостью от внешних заинтересованных сторон, вам следует пересмотреть существующие ограничения WIP на вашей доске Kanban и сосредоточиться на завершении текущих задач, прежде чем начинать новые.

Вы также должны помнить о возможном 4-м сценарии – полосы падают. Если какая-либо полоса на вашей совокупной диаграмме потока опускается, диаграмма неверна. Задача никогда не должна исчезать из рабочего процесса.

В заключение, кумулятивная блок-схема – это расширенный аналитический инструмент, который даст вам точное представление о том, насколько стабилен ваш процесс и насколько эффективна ваша команда.Вы можете получить практический совет о том, на чем вам нужно сосредоточить свои усилия, чтобы с первого взгляда улучшить свой процесс.

Попробовать Kanbanize бесплатно

В итоге

Кумулятивная блок-схема – одна из самых продвинутых аналитических схем в гибком управлении проектами.

  • Обеспечивает краткую визуализацию показателей потока.
  • Он показывает, насколько стабильный ваш поток, и помогает понять, на чем следует сосредоточиться, чтобы сделать ваш процесс более предсказуемым.
  • Дает количественное и качественное представление как о прошлых, так и о существующих проблемах.

График Ogive / Полигон кумулятивной частоты в простых шагах

Описательная статистика> График Ogive

Что такое граф Ogive?

Огив ( oh-jive ), иногда называемый многоугольником совокупной частоты, представляет собой тип многоугольника частот, который показывает совокупные частоты.Другими словами, накопленные проценты добавляются на график слева направо.

Оживительный график отображает кумулятивную частоту по оси y и границы классов по оси x. Это очень похоже на гистограмму, только вместо прямоугольников живое изображение имеет одну точку, отмеченную там, где будет правый верхний угол прямоугольника. Такой график обычно проще построить из таблицы частот.

Посмотрите видео, в котором показан пример того, как вручную построить график ожив:


Не можете посмотреть видео? Кликните сюда.

Как нарисовать граф Ogive

Пример вопроса: Нарисуйте график Ogive для следующего набора данных:
2, 7, 3, 8, 3, 15, 19, 16, 17, 13, 29, 20, 21, 21, 22, 25, 31, 51, 55, 55, 57, 58, 56, 57, 58.

Шаг 1: Составьте таблицу относительной частоты на основе данных. В первом столбце указаны пределы класса, во втором столбце – частота (количество), а в третьем столбце – относительная частота (частота класса / общее количество элементов):

Если вы не знаете, как создать свой класс лимитов (также называемых корзинами), посмотрите видео внизу этой статьи или посмотрите: Что такое корзина в статистике?

Шаг 2: Добавьте четвертый столбец и суммируйте частоты в столбце 2, двигаясь сверху вниз.Например, вторая запись представляет собой сумму первой строки и второй строки в столбце частоты (5 + 5 = 10), а третья запись представляет собой сумму первой, второй и третьей строк в столбце частоты ( 5 + 5 + 6 = 16):

Шаг 3: Добавьте пятый столбец и накопите относительных частот из столбца 3. Если вы выполните этот шаг правильно, ваши значения должны составить до 100% (или 1 как десятичный):

Шаг 4: Постройте декартову плоскость (график xy) с процентной кумулятивной относительной частотой по оси y (от 0 до 100% или в виде десятичной дроби от 0 до 1).Отметьте ось абсцисс с границами классов.

Шаг 5: Нанесите на карту свои очки. Примечание : Каждая точка должна быть нанесена на верхнюю границу границы класса. Например, если ваша граница первого класса составляет от 0 до 10, точка должна быть нанесена на 10.

Шаг 6: Соедините точки прямыми линиями. ожив – это одна непрерывная линия, состоящая из нескольких линий меньшего размера, соединяющих пары точек, движущихся слева направо.

Готовый график для этого примера данных:

Совет : Как создать видео границ классов:


Не можете посмотреть видео? Кликните сюда.

Список литературы

Агрести А. (1990) Анализ категориальных данных. Джон Вили и сыновья, Нью-Йорк.
Левин Д. (2014). Даже вы можете изучить статистику и аналитику: простое для понимания руководство по статистике и аналитике, 3-е издание. Пресс Pearson FT

————————————————– —————————-

Нужна помощь с домашним заданием или контрольным вопросом? С Chegg Study вы можете получить пошаговые решения на свои вопросы от эксперта в данной области.Ваши первые 30 минут с репетитором Chegg бесплатны!

Комментарии? Нужно опубликовать исправление? Пожалуйста, оставьте комментарий на нашей странице в Facebook .


8.2 Участок накопленных местных эффектов (ОВЭ)

Участок накопленных местных эффектов (ОВЭ)

Накопленные локальные эффекты описывают, как функции в среднем влияют на прогноз модели машинного обучения. Графики ALE – более быстрая и беспристрастная альтернатива графикам частичной зависимости (PDP).

Я рекомендую сначала прочитать главу о графиках частичной зависимости, так как они более легкие для понимания и оба метода преследуют одну и ту же цель: Оба описывают, как функция в среднем влияет на прогноз. В следующем разделе я хочу убедить вас, что графики частичной зависимости имеют серьезную проблему, когда функции коррелированы.

Мотивация и интуиция

Если функции модели машинного обучения коррелированы, графику частичной зависимости нельзя доверять.Вычисление графика частичной зависимости для признака, который сильно коррелирован с другими признаками, включает усреднение прогнозов экземпляров искусственных данных, которые в действительности маловероятны. Это может сильно повлиять на оценку эффекта функции. Представьте себе расчет графиков частичной зависимости для модели машинного обучения, которая прогнозирует стоимость дома в зависимости от количества комнат и размера жилой площади. Нас интересует влияние жилой площади на прогнозируемое значение. Напоминаем, что рецепт построения графиков частичной зависимости таков: 1) Выбрать объект.2) Определите сетку. 3) По значению сетки: а) Замените объект значением сетки и б) средним прогнозом. 4) Нарисуйте кривую. Для расчета первого значения сетки PDP – скажем, 30 м 2 – мы заменяем жилую площадь для всех экземпляров на 30 м 2 , даже для домов с 10 комнатами. Для меня это очень необычный дом. График частичной зависимости включает эти нереалистичные дома в оценку эффекта функции и делает вид, что все в порядке. На следующем рисунке показаны две коррелированные функции и то, как получается, что метод построения графика частичной зависимости усредняет прогнозы маловероятных случаев.

РИСУНОК 8.5: Сильно коррелированные характеристики x1 и x2. Чтобы вычислить влияние характеристик x1 на 0,75, PDP заменяет x1 всех экземпляров на 0,75, ошибочно предполагая, что распределение x2 при x1 = 0,75 совпадает с предельным распределением x2 (вертикальная линия). Это приводит к маловероятным комбинациям x1 и x2 (например, x2 = 0,2 при x1 = 0,75), которые PDP использует для вычисления среднего эффекта.

Что мы можем сделать, чтобы получить оценку эффекта функции, которая учитывает корреляцию функций? Мы могли бы усреднить условное распределение функции, то есть при значении сетки x1 мы усредняем прогнозы экземпляров с аналогичным значением x1.Решение для расчета эффектов признаков с использованием условного распределения называется предельными графиками или M-графиками (название сбивает с толку, поскольку они основаны на условном, а не на предельном распределении). Подождите, разве я не обещал вам говорить о заговорах ALE? M-Plots – это не то решение, которое мы ищем. Почему M-Plots не решают нашу проблему? Если мы усредним прогнозы для всех домов площадью около 30 м 2 , мы оценим комбинированный эффект жилой площади и количества комнат из-за их корреляции.Предположим, что жилая площадь не влияет на прогнозируемую стоимость дома, а влияет только количество комнат. M-график все равно будет показывать, что размер жилой площади увеличивает прогнозируемое значение, поскольку количество комнат увеличивается с жилой площадью. На следующем графике для двух коррелированных функций показано, как работают M-графики.

РИСУНОК 8.6: Сильно коррелированные характеристики x1 и x2. M-графики усредняют условное распределение. Здесь условное распределение x2 при x1 = 0,75.Усреднение локальных прогнозов приводит к смешиванию эффектов обеих функций.

M-Plots избегают усреднения прогнозов маловероятных экземпляров данных, но они смешивают эффект функции с эффектами всех коррелированных функций. Графики ALE решают эту проблему, вычисляя – также на основе условного распределения признаков – разницы в прогнозах вместо средних . Для эффекта жилой площади на высоте 30 м 2 метод ALE использует все дома площадью около 30 м 2 , получает прогнозы модели, предполагающие, что эти дома были 31 м 2 минус прогноз, предполагающий, что они были 29 м 2 .Это дает нам чистый эффект жилой зоны и не смешивает эффект с эффектами взаимосвязанных элементов. Использование различий блокирует действие других функций. На следующем рисунке показано, как рассчитываются графики ALE.

РИСУНОК 8.7: Расчет ALE для признака x1, который коррелирует с x2. Сначала мы делим объект на интервалы (вертикальные линии). Для экземпляров данных (точек) в интервале мы вычисляем разницу в прогнозе, когда мы заменяем признак на верхнюю и нижнюю границу интервала (горизонтальные линии).Эти различия позже накапливаются и центрируются, в результате чего получается кривая ALE.

Чтобы суммировать, как каждый тип графика (PDP, M, ALE) вычисляет эффект объекта при определенном значении сетки v:
Графики частичной зависимости : «Позвольте мне показать вам, что модель предсказывает в среднем, когда каждый экземпляр данных имеет значение v для этой функции. Я игнорирую, имеет ли значение v смысл для всех экземпляров данных ».
M-Plots : «Позвольте мне показать вам, что модель предсказывает в среднем для экземпляров данных, которые имеют значения, близкие к v для этой функции.Эффект может быть связан с этой функцией, но также с коррелированными функциями ».
ALE строит графики : «Позвольте мне показать вам, как прогнозы модели меняются в небольшом« окне »объекта вокруг v для экземпляров данных в этом окне».

Теория

Чем отличаются графики PD, M и ALE математически? Общим для всех трех методов является то, что они сводят сложную функцию прогнозирования f к функции, которая зависит только от одной (или двух) характеристик. Все три метода уменьшают функцию за счет усреднения эффектов других функций, но они различаются тем, вычисляются ли средние значения прогнозов или различий в прогнозах и выполняется ли усреднение по маржинальному или условному распределению.

Графики частичной зависимости усредняют прогнозы по предельному распределению.

\ [\ begin {align *} \ hat {f} _ {S, PDP} (x) & = E_ {X_C} \ left [\ hat {f} (x_S, X_C) \ right] \\ & = \ int_ {X_C} \ hat {f} (x_S, X_C) d \ mathbb {P} (X_C) \ end {align *} \]

Это значение функции прогнозирования f при значении (ях) объекта \ (x_S \), усредненное по всем объектам в \ (X_C \) (здесь рассматривается как случайные переменные). Усреднение означает вычисление предельного ожидания E по характеристикам в наборе C, которое является интегралом по прогнозам, взвешенным по распределению вероятностей.Звучит фантастично, но для расчета ожидаемого значения по маржинальному распределению мы просто берем все наши экземпляры данных, заставляем их иметь определенное значение сетки для функций в наборе S и усредняем прогнозы для этого измененного набора данных. Эта процедура гарантирует, что мы усредним маржинальное распределение функций.

M-графика усредняют прогнозы по условному распределению.

\ [\ begin {align *} \ hat {f} _ {S, M} (x_S) & = E_ {X_C | X_S} \ left [\ hat {f} (X_S, X_C) | X_S = x_s \ right » ] \\ & = \ int_ {X_C} \ hat {f} (x_S, X_C) d \ mathbb {P} (X_C | X_S = x_S) \ end {align *} \]

Единственное, что меняется по сравнению с PDP, – это то, что мы усредняем прогнозы, обусловленные каждым значением сетки интересующего объекта, вместо того, чтобы предполагать предельное распределение для каждого значения сетки.S (x_s, x_c) = \ frac {\ partial \ hat {f} (x_S, x_C)} {\ partial {} x_S} \]

Второе отличие – дополнительный интеграл по z. Мы накапливаем локальные частные производные по диапазону признаков в наборе S, что дает нам влияние признака на прогноз. Для фактических вычислений z заменяются сеткой интервалов, по которым мы вычисляем изменения в прогнозе. Вместо прямого усреднения прогнозов метод ALE вычисляет различия прогнозов, обусловленные признаками S, и интегрирует производную по признакам S, чтобы оценить эффект.Что ж, это звучит глупо. Деривация и интегрирование обычно компенсируют друг друга, например сначала вычитание, а затем добавление одного и того же числа. Почему это имеет смысл? Производная (или разность интервалов) изолирует эффект интересующего признака и блокирует эффект коррелированных признаков.

Третье отличие графиков ALE от графиков M состоит в том, что мы вычитаем константу из результатов. На этом этапе график ALE центрируется, так что средний эффект по данным равен нулю.

Остается одна проблема: Не все модели имеют градиент, например случайные леса не имеют градиента.Но, как вы увидите, фактическое вычисление работает без градиентов и использует интервалы. Давайте немного углубимся в оценку графиков ALE.

Оценка

Сначала я опишу, как графики ALE оцениваются для одного числового признака, позже для двух числовых признаков и для одного категориального признака. Чтобы оценить локальные эффекты, мы делим объект на множество интервалов и вычисляем различия в прогнозах. Эта процедура аппроксимирует производные, а также работает для моделей без производных.{(i)} _ {\ setminus {} j}) \ right] \]

Давайте разберем эту формулу, начиная с правой стороны. Название Accumulated Local Effects прекрасно отражает все отдельные компоненты этой формулы. По своей сути, метод ALE вычисляет различия в прогнозах, при этом мы заменяем интересующий объект значениями сетки z. Разница в прогнозировании – это эффект Effect , который функция имеет для отдельного экземпляра в определенном интервале. Сумма справа складывает эффекты всех экземпляров в пределах интервала, который появляется в формуле как окрестность \ (N_j (k) \).Мы делим эту сумму на количество экземпляров в этом интервале, чтобы получить среднюю разницу прогнозов для этого интервала. Это среднее значение в интервале покрывается термином Local в имени ALE. Левый символ суммы означает, что мы накапливаем средние эффекты по всем интервалам. (Нецентрированный) ALE значения характеристики, которое находится, например, в третьем интервале, представляет собой сумму эффектов первого, второго и третьего интервалов. Слово Накоплено в ALE отражает это.{(i)} _ {j}) \]

Значение ALE можно интерпретировать как основной эффект функции при определенном значении по сравнению со средним предсказанием данных. Например, оценка ALE, равная -2 при \ (x_j = 3 \), означает, что когда j-й признак имеет значение 3, то прогноз ниже на 2 по сравнению со средним прогнозом.

Квантили распределения признака используются в качестве сетки, определяющей интервалы. Использование квантилей гарантирует, что в каждом из интервалов будет одинаковое количество экземпляров данных.Недостаток квантилей состоит в том, что интервалы могут иметь очень разную длину. Это может привести к появлению некоторых странных графиков ALE, если интересующий объект сильно искажен, например, много низких значений и только несколько очень высоких значений.

Графики ALE для взаимодействия двух функций

Графики

ALE также могут отображать эффект взаимодействия двух функций. Принципы расчета такие же, как и для отдельного объекта, но мы работаем с прямоугольными ячейками вместо интервалов, потому что нам нужно накапливать эффекты в двух измерениях.Помимо корректировки общего среднего эффекта, мы также настраиваем основные эффекты обеих функций. Это означает, что ALE для двух функций оценивает эффект второго порядка, который не включает основные эффекты функций. Другими словами, ALE для двух функций показывает только дополнительный эффект взаимодействия этих двух функций. Я избавляю вас от формул для 2D-графиков ALE, потому что они длинные и неприятные для чтения. Если вас интересует расчет, отсылаю к статье, формулы (13) – (16).Я буду полагаться на визуализации, чтобы развить интуицию относительно вычисления ALE второго порядка.

РИСУНОК 8.8: Расчет 2D-ALE. Мы размещаем сетку над двумя объектами. В каждой ячейке сетки мы вычисляем различия 2-го порядка для всех экземпляров внутри. Сначала мы заменяем значения x1 и x2 значениями из углов ячеек. Если a, b, c и d представляют собой «угловые» прогнозы манипулируемого экземпляра (как отмечено на рисунке), то разница 2-го порядка будет (d – c) – (b – a). Средняя разница 2-го порядка в каждой ячейке накапливается по сетке и центрируется.

На предыдущем рисунке многие ячейки пусты из-за корреляции. На графике ALE это можно визуализировать с помощью серого или затемненного прямоугольника. В качестве альтернативы вы можете заменить отсутствующую оценку ALE пустой ячейки оценкой ALE ближайшей непустой ячейки.

Поскольку оценки ALE для двух функций показывают только эффект второго порядка, интерпретация требует особого внимания. Эффект второго порядка – это дополнительный эффект взаимодействия функций после того, как мы учли основные эффекты функций.Предположим, что две функции не взаимодействуют, но каждая из них линейно влияет на прогнозируемый результат. На одномерном графике ALE для каждой функции мы увидим прямую линию как расчетную кривую ALE. Но когда мы строим 2D-оценки ALE, они должны быть близки к нулю, потому что эффект второго порядка – это только дополнительный эффект взаимодействия. В этом отношении графики ALE и PD различаются: PDP всегда показывают общий эффект, графики ALE показывают эффект первого или второго порядка. Это проектные решения, не зависящие от математики, лежащей в основе.Вы можете вычесть эффекты более низкого порядка на графике частичной зависимости, чтобы получить чистые эффекты основного или второго порядка, или вы можете получить оценку общих графиков ALE, воздерживаясь от вычитания эффектов более низкого порядка.

Накопленные локальные эффекты также могут быть рассчитаны для произвольно более высоких порядков (взаимодействия трех или более функций), но, как утверждается в главе PDP, только до двух функций имеют смысл, потому что более высокие взаимодействия не могут быть визуализированы или даже интерпретированы осмысленно.

ALE для категориальных признаков

Метод накопленных локальных эффектов требует, по определению, чтобы значения характеристик имели порядок, потому что метод накапливает эффекты в определенном направлении. Категориальные признаки не имеют естественного порядка. Чтобы вычислить график ALE для категориального признака, мы должны каким-то образом создать или найти порядок. Порядок категорий влияет на расчет и интерпретацию накопленных локальных эффектов.

Одно из решений – упорядочить категории в соответствии с их сходством на основе других функций.Расстояние между двумя категориями – это сумма расстояний каждого объекта. Расстояние по признакам сравнивает либо кумулятивное распределение в обеих категориях, также называемое расстоянием Колмогорова-Смирнова (для числовых признаков), либо таблицы относительной частоты (для категориальных признаков). Когда у нас есть расстояния между всеми категориями, мы используем многомерное масштабирование, чтобы уменьшить матрицу расстояний до одномерной меры расстояния. Это дает нам порядок категорий на основе сходства.

Чтобы сделать это немного понятнее, вот один пример: Предположим, у нас есть две категориальные характеристики «сезон» и «погода» и числовая характеристика «температура». Для первого категориального признака (сезона) мы хотим рассчитать ALE. Функция имеет категории «весна», «лето», «осень», «зима». Начинаем рассчитывать дистанцию ​​между категориями «весна» и «лето». Расстояние – это сумма расстояний по характеристикам температуры и погоды. Для температуры мы берем все экземпляры с сезоном «весна», вычисляем эмпирическую кумулятивную функцию распределения и делаем то же самое для экземпляров с сезоном «лето» и измеряем их расстояние с помощью статистики Колмогорова-Смирнова.Для характеристики погоды мы рассчитываем вероятности для всех «весенних» случаев для каждого типа погоды, делаем то же самое для «летних» случаев и суммируем абсолютные расстояния в распределении вероятностей. Если «весна» и «лето» имеют очень разные температуры и погоду, общее расстояние между категориями велико. Мы повторяем процедуру с другими сезонными парами и уменьшаем полученную матрицу расстояний до одного измерения путем многомерного масштабирования.

Примеры

Давайте посмотрим на графики ALE в действии.Я построил сценарий, в котором графики частичной зависимости терпят неудачу. Сценарий состоит из модели прогнозирования и двух сильно коррелированных функций. Модель прогнозирования в основном представляет собой модель линейной регрессии, но делает что-то странное в сочетании двух функций, для которых мы никогда не наблюдали случаев.

РИСУНОК 8.9: Две характеристики и прогнозируемый результат. Модель предсказывает сумму двух функций (заштрихованный фон), за исключением случая, когда x1 больше 0.7 и x2 меньше 0,3, модель всегда прогнозирует 2. Эта область далека от распределения данных (облако точек) и не влияет на производительность модели, а также не должна влиять на ее интерпретацию.

Это вообще реалистичный и актуальный сценарий? При обучении модели алгоритм обучения минимизирует потери для существующих экземпляров обучающих данных. Странные вещи могут происходить за пределами распределения обучающих данных, потому что модель не наказывается за странные вещи в этих областях.Отказ от распределения данных называется экстраполяцией, которую также можно использовать для обмана моделей машинного обучения, описанных в главе, посвященной примерам состязательности. Посмотрите в нашем небольшом примере, как графики частичной зависимости ведут себя по сравнению с графиками ALE.

РИСУНОК 8.10: Сравнение эффектов функций, вычисленных с помощью PDP (верхний ряд) и ALE (нижний ряд). На оценки PDP влияет странное поведение модели вне распределения данных (крутые скачки на графиках). Графики ALE правильно определяют, что модель машинного обучения имеет линейную связь между функциями и прогнозом, игнорируя области без данных.

Но разве не интересно видеть, что наша модель ведет себя странно при x1> 0,7 и x2 <0,3? Ну и да, и нет. Поскольку это экземпляры данных, которые могут быть физически невозможными или, по крайней мере, крайне маловероятными, обычно не имеет значения изучать эти экземпляры. Но если вы подозреваете, что ваше тестовое распределение может немного отличаться и некоторые экземпляры действительно находятся в этом диапазоне, было бы интересно включить эту область в расчет эффектов функций. Но это должно быть осознанное решение включить области, данные по которым мы еще не наблюдали, и это не должно быть побочным эффектом такого метода выбора, как PDP.Если вы подозреваете, что модель позже будет использоваться с другими распределенными данными, я рекомендую использовать графики ALE и моделировать распределение ожидаемых данных.

Обращаясь к реальному набору данных, давайте спрогнозируем количество арендованных велосипедов на основе погоды и дня и проверим, действительно ли графики ALE работают так, как было обещано. Мы обучаем дерево регрессии для прогнозирования количества велосипедов, взятых напрокат в данный день, и используем графики ALE для анализа того, как температура, относительная влажность и скорость ветра влияют на прогнозы.Давайте посмотрим, что говорят графики ALE:

РИСУНОК 8.11: Графики ALE для модели прогнозирования велосипеда по температуре, влажности и скорости ветра. Температура сильно влияет на прогноз. Средний прогноз повышается с повышением температуры, но снова падает выше 25 градусов Цельсия. Влажность имеет отрицательный эффект: чем выше 60%, тем ниже прогноз. Скорость ветра не сильно влияет на прогнозы.

Давайте посмотрим на взаимосвязь между температурой, влажностью и скоростью ветра и всеми другими характеристиками.Поскольку данные также содержат категориальные признаки, мы не можем использовать только коэффициент корреляции Пирсона, который работает только в том случае, если оба признака являются числовыми. Вместо этого я обучаю линейную модель предсказанию, например, температуры на основе одной из других характеристик в качестве входных данных. Затем я измеряю, какую дисперсию объясняет другая функция линейной модели, и извлекаю квадратный корень. Если другой признак был числовым, то результат равен абсолютному значению стандартного коэффициента корреляции Пирсона.Но этот основанный на модели подход «объяснения дисперсии» (также называемый ANOVA, что означает «анализ VAriance») работает, даже если другая функция категориальна. Показатель «объясненной дисперсией» всегда находится между 0 (нет связи) и 1 (температуру можно точно предсказать по другой характеристике). Мы вычисляем объясненную разницу температуры, влажности и скорости ветра со всеми другими характеристиками. Чем выше объясненная дисперсия (корреляция), тем больше (потенциальных) проблем с графиками PD.На следующем рисунке показано, насколько сильно погодные особенности коррелируют с другими характеристиками.

РИСУНОК 8.12: Сила корреляции между температурой, влажностью и скоростью ветра со всеми характеристиками, измеренная как величина объясненной дисперсии, когда мы обучаем линейную модель, например, с помощью температура для прогнозирования и сезон как характеристика. Что касается температуры, мы наблюдаем, что неудивительно, высокую корреляцию с сезоном и месяцем. Влажность коррелирует с погодной ситуацией.

Этот корреляционный анализ показывает, что мы можем столкнуться с проблемами при построении графиков частичной зависимости, особенно для температурной характеристики.Что ж, смотрите сами:

РИСУНОК 8.13: PDP для температуры, влажности и скорости ветра. По сравнению с графиками ALE, PDP показывают меньшее уменьшение прогнозируемого количества велосипедов для высокой температуры или высокой влажности. PDP использует все экземпляры данных для расчета влияния высоких температур, даже если это, например, экземпляры с сезоном «зима». Графики ALE более надежны.

Теперь давайте посмотрим, как работают графики ALE для категориальной функции. Месяц – это категориальная характеристика, для которой мы хотим проанализировать влияние на прогнозируемое количество велосипедов.Возможно, в месяцах уже есть определенный порядок (с января по декабрь), но давайте попробуем посмотреть, что произойдет, если мы сначала изменим порядок категорий по сходству, а затем вычислим эффекты. Месяцы отсортированы по сходству дней каждого месяца на основе других характеристик, таких как температура или выходной день.

РИСУНОК 8.14: График ALE для месяца категориального признака. Месяцы отсортированы по их сходству друг с другом на основе распределения других функций по месяцам.Мы наблюдаем, что январь, март и апрель, но особенно декабрь и ноябрь, имеют меньшее влияние на прогнозируемое количество арендованных велосипедов по сравнению с другими месяцами.

Поскольку многие функции связаны с погодой, порядок месяцев сильно отражает, насколько похожа погода между месяцами. Все холодные месяцы находятся слева (с февраля по апрель), а теплые – справа (с октября по август). Имейте в виду, что в расчет подобия также были включены внепогодные характеристики, например, относительная частота праздников имеет тот же вес, что и температура, для расчета сходства между месяцами.

Далее мы рассмотрим влияние влажности и температуры второго порядка на прогнозируемое количество велосипедов. Помните, что эффект второго порядка – это дополнительный эффект взаимодействия двух функций и не включает основные эффекты. Это означает, что, например, вы не увидите основного эффекта, заключающегося в том, что высокая влажность приводит к меньшему количеству прогнозируемых велосипедов в среднем на графике ALE второго порядка.

РИСУНОК 8.15: График ALE для влияния влажности и температуры 2-го порядка на прогнозируемое количество взятых напрокат велосипедов.Более светлый оттенок указывает на значение выше среднего, а более темный оттенок – на прогноз ниже среднего, когда основные эффекты уже приняты во внимание. Сюжет показывает взаимосвязь между температурой и влажностью: жаркая и влажная погода увеличивает прогноз. В холодную и влажную погоду проявляется дополнительный негативный эффект на количество прогнозируемых велосипедов.

Имейте в виду, что оба основных воздействия влажности и температуры говорят о том, что прогнозируемое количество велосипедов уменьшается в очень жаркую и влажную погоду.Таким образом, в жаркую и влажную погоду комбинированное воздействие температуры и влажности не является суммой основных эффектов, а больше, чем сумма. Чтобы подчеркнуть разницу между чистым эффектом второго порядка (двухмерный график ALE, который вы только что видели) и общим эффектом, давайте посмотрим на график частичной зависимости. PDP показывает общий эффект, который сочетает в себе прогноз среднего, два основных эффекта и эффект второго порядка (взаимодействие).

РИСУНОК 8.16: PDP общего влияния температуры и влажности на прогнозируемое количество велосипедов.График сочетает в себе основной эффект каждой из функций и эффект их взаимодействия, в отличие от графика 2D-ALE, который показывает только взаимодействие.

Если вас интересует только взаимодействие, вам следует обратить внимание на эффекты второго порядка, потому что общий эффект смешивает основные эффекты с сюжетом. Но если вы хотите узнать совокупный эффект функций, вам следует посмотреть на общий эффект (который показывает PDP). Например, если вы хотите узнать ожидаемое количество велосипедов при 30 градусах Цельсия и 80-процентной влажности, вы можете прочитать его прямо с 2D PDP.Если вы хотите прочитать то же самое из графиков ALE, вам нужно посмотреть на три графика: График ALE для температуры, влажности и температуры + влажности, и вам также необходимо знать общий прогноз среднего значения. В сценарии, где две функции не взаимодействуют друг с другом, график общего эффекта двух функций может вводить в заблуждение, потому что он, вероятно, показывает сложный ландшафт, предполагающий некоторое взаимодействие, но это просто продукт двух основных эффектов. Эффект второго порядка сразу показал бы отсутствие взаимодействия.

Пока хватит велосипедов, перейдем к задаче классификации. Мы обучаем случайный лес прогнозировать вероятность рака шейки матки на основе факторов риска. Мы визуализируем накопленные локальные эффекты для двух функций:

РИСУНОК 8.17: Графики ALE влияния возраста и лет с гормональными контрацептивами на прогнозируемую вероятность рака шейки матки. Что касается возрастного признака, график ALE показывает, что прогнозируемая вероятность рака в среднем низка до 40 лет и увеличивается после этого.Количество лет использования гормональных контрацептивов связано с более высоким прогнозируемым риском рака после 8 лет.

Далее мы рассмотрим взаимосвязь между количеством беременностей и возрастом.

РИСУНОК 8.18: График ALE эффекта 2-го порядка количества беременностей и возраста. Интерпретация сюжета немного неубедительна, показывая то, что кажется перебором. Например, график показывает странное модельное поведение в возрасте 18–20 лет и более трех беременностей (увеличение вероятности рака до 5 процентных пунктов).В данных не так много женщин с таким сочетанием возраста и количества беременностей (фактические данные отображаются в виде точек), поэтому модель не подвергается серьезным штрафам во время обучения за то, что они допустили ошибки для этих женщин.

Преимущества

Графики ALE не смещены , что означает, что они все еще работают, когда объекты коррелированы. Графики частичной зависимости терпят неудачу в этом сценарии, потому что они маргинализируются из-за маловероятных или даже физически невозможных комбинаций значений признаков.

Графики ALE вычисляются быстрее, чем PDP, и масштабируются с O (n), поскольку максимально возможное количество интервалов – это количество экземпляров с одним интервалом на экземпляр. PDP требует в n раз больше оценок точек сетки. Для 20 точек сетки PDP требует в 20 раз больше прогнозов, чем график ALE наихудшего случая, где используется столько же интервалов, сколько экземпляров.

Интерпретация графиков ALE ясна : При условии заданного значения, относительный эффект изменения признака на прогноз можно прочитать из графика ALE. Графики ALE центрируются по нулю . Это делает их интерпретацию удобной, потому что значение в каждой точке кривой ALE – это разница со средним прогнозом. Двухмерный график ALE показывает только взаимодействие : Если две функции не взаимодействуют, на графике ничего не отображается.

Вся функция прогнозирования может быть разложена на сумму низкоразмерных функций ALE, как объяснено в главе, посвященной функциональной декомпозиции.

В общем, в большинстве ситуаций я бы предпочел графики ALE, а не PDP , потому что функции обычно в некоторой степени коррелированы.

Недостатки

Интерпретация эффекта по интервалам недопустима , если признаки сильно коррелированы. Рассмотрим случай, когда ваши функции сильно коррелированы, и вы смотрите на левый конец графика 1D-ALE. Кривая ALE может вызвать следующее неправильное толкование: «Кривая ALE показывает, как в среднем изменяется прогноз, когда мы постепенно меняем значение соответствующей функции для экземпляра данных и сохраняем фиксированные значения других функций для экземпляров.” Эффекты рассчитываются для каждого интервала (локально), поэтому интерпретация эффекта может быть только локальной. Для удобства эффекты по интервалам накапливаются, чтобы показать плавную кривую, но имейте в виду, что каждый интервал создается с разными экземплярами данных.

Эффекты ALE могут отличаться от коэффициентов, указанных в модели линейной регрессии, когда функции взаимодействуют и коррелируют. Грёмпинг (2020) показал, что в линейной модели с двумя коррелированными характеристиками и дополнительным членом взаимодействия (\ (\ hat {f} (x) = \ beta_0 + \ beta_1 x_1 + \ beta_2 x_2 + \ beta_3 x_1 x_2 \)), графики ALE первого порядка не показывают прямой линии.Вместо этого они слегка изогнуты, потому что включают в себя части мультипликативного взаимодействия функций. Чтобы понять, что здесь происходит, я рекомендую прочитать главу о декомпозиции функций. Короче говоря, ALE определяет эффекты первого порядка (или 1D) иначе, чем их описывает линейная формула. Это не обязательно неправильно, потому что, когда функции коррелируют, атрибуция взаимодействий не так ясна. Но это, конечно, нелогично, что ALE и линейный коэффициент не совпадают.

Графики ALE могут быть немного шаткими (много мелких взлетов и падений) с большим количеством интервалов. В этом случае уменьшение количества интервалов делает оценки более стабильными, но также сглаживает и скрывает некоторую часть истинной сложности модели прогнозирования. Не существует идеального решения для установки количества интервалов . Если число слишком мало, графики ALE могут быть не очень точными. Если число будет слишком большим, кривая может стать шаткой.

В отличие от PDP, графики ALE не сопровождаются кривыми ICE .Для PDP кривые ICE хороши, потому что они могут выявить неоднородность в эффекте функции, что означает, что эффект функции выглядит по-разному для подмножеств данных. Для графиков ALE вы можете проверять только на каждом интервале, отличается ли эффект между экземплярами, но каждый интервал имеет разные экземпляры, поэтому он не совпадает с кривыми ICE.

Оценки ALE второго порядка имеют разную стабильность в пространстве признаков, что никак не визуализируется. Причина этого в том, что каждая оценка локального эффекта в ячейке использует разное количество экземпляров данных.В результате все оценки имеют разную точность (но они по-прежнему являются наилучшими возможными оценками). Проблема существует в менее серьезной версии для графиков ALE с основными эффектами. Количество экземпляров одинаково во всех интервалах благодаря использованию квантилей в качестве сетки, но в некоторых областях будет много коротких интервалов, и кривая ALE будет состоять из гораздо большего количества оценок. Но для длинных интервалов, которые могут составлять большую часть всей кривой, случаев сравнительно меньше. Это произошло, например, на графике ALE для прогнозирования рака шейки матки для пожилого возраста.

Графики эффектов второго порядка могут немного утомлять интерпретацию , так как вы всегда должны помнить об основных эффектах. Заманчиво рассматривать тепловые карты как суммарный эффект двух функций, но это лишь дополнительный эффект взаимодействия. Чистый эффект второго порядка интересен для обнаружения и изучения взаимодействий, но для интерпретации того, как выглядит эффект, я думаю, имеет смысл интегрировать основные эффекты в сюжет.

Реализация графиков ALE намного сложнее и менее интуитивно понятна по сравнению с графиками частичной зависимости.

Несмотря на то, что графики ALE не смещены в случае коррелированных признаков, интерпретация остается сложной, когда признаки сильно коррелированы . Потому что, если у них очень сильная корреляция, имеет смысл анализировать эффект изменения обеих функций вместе, а не по отдельности. Этот недостаток не является специфическим для графиков ALE, а является общей проблемой сильно коррелированных функций.

Если функции не коррелированы и время вычислений не является проблемой, PDP немного предпочтительнее, потому что их легче понять и их можно построить вместе с кривыми ICE.

Список недостатков стал довольно длинным, но пусть вас не обманывает количество слов, которые я использую: Практическое правило: используйте ALE вместо PDP.

Кривая «вид – накопление» и оценка видового богатства – Угланд – 2003 – Журнал экологии животных

В следующем исследовании мы используем два набора данных. Один взят с норвежского континентального шельфа бентических видов, встречающихся в пяти районах на трансекте протяженностью 1960 км, охватывающих 809 видов из 101 образца, каждая из которых составляет 0,5 м 2 (Ellingsen & Gray 2002).Другой получен в результате обширного исследования бентоса донных отложений в масштабе пространственной выборки . 1100 км 2 в территориальных водах САР Гонконг, Китай. Данные взяты из 101 образца каждая из 0,5 м 2 и содержат 386 видов (Shin неопубликовано).

аналитические выражения для кривой накопления видов, ее дисперсии и полулогарифмического приближения

Аррениус (1921) был первым, кто приспособил модель к данным об увеличении числа видов при увеличении размера выборки области (см. McGuinness 1984 для хорошего обзора истории кривой вид – площадь).В этой статье Аррениус (1921) прямо заметил, что его формула мощности, S = S ( A ) = dA Z , была эмпирической и должна рассматриваться как приближение, существование которого полностью зависело от согласия. с данными из списков растительного мира, которые он получил. Поскольку его формула рассчитывала среднее количество видов, произрастающих на территории, Аррениус также поставил задачу создания стохастической модели видового богатства в подрайоне a большой площади A .Чтобы связать ареал с встречаемостью видов, он предположил, что любой особь любого вида имеет одинаковую вероятность a / A встречаться в подрайоне a . Теперь, если n i – это количество особей, принадлежащих к i -му виду, вероятность того, что i -й вид не найден в подрайоне, составляет:

(уравнение 1)

Таким образом, вероятность того, что -й вид произрастает в подрайоне, составляет

. (уравнение 2)

Поскольку «сумма этих вероятностей представляет собой вероятное количество видов в районе», Аррениус (1921) получил следующее аналитическое выражение для ожидаемого количества видов в подрайоне a :

(уравнение 3)

Здесь важно отметить, что Аррениус моделировал заселенность каждого вида как случайное размещение растений с заменой, но со статистической точки зрения это выражение основывается на предельной теореме для гипергеометрического распределения; или, как утверждает Феллер (1950): «Для больших популяций практически нет разницы между выборкой с заменой и без нее.’

Очевидное обобщение выборки с заменой состоит в простом использовании гипергеометрического распределения, а не бинома, используемого Аррениусом. Подобные подходы были применены более или менее независимо несколькими авторами, которые исследовали распределение особей и характер присутствия / отсутствия видов (например, Hurlbert 1971; Heck et al . 1975; Brewer & Williamson 1980; Coleman 1981; Ney-Nifle & Мангель 1999). Все эти предложенные формулы можно рассматривать как варианты исходной модели Аррениуса (1921).

В отличие от вычисления математического ожидания, гораздо труднее найти аналитические выражения для дисперсии. Хек, Белль и Симберлофф (1975) предложили формулу для дисперсии кривых разрежения, основанную на индивидуумах. Проблема нахождения соответствующей формулы разрежения по образцам более сложна и до сих пор не решена. В своем исследовании структуры присутствия / отсутствия видов в сборке Ney-Nifle & Mangel (1999) использовали гипергеометрическую формулу для присутствия видов в выборке и клеток без замены.Однако, чтобы получить выражение для дисперсии, они вывели формулу Аррениуса для q i ( a ), перейдя к пределу, когда A намного больше, чем количество ячеек, и все Занятости n i намного меньше, чем общее количество единиц (ячеек): n i << A . Сделав переход к модели Арренхиуса (1921) (выборка с заменой), Ней-Нифл и Мангель (1999) вывели дисперсию числа видов в подрайоне a , рассматривая ее как сумму независимых биномиальных испытаний (Feller 1950):

(уравнение 4)

Однако эту процедуру нельзя применить к кривым накопления, поскольку предположение, что все n i << A означает, что все виды должны быть очень редкими в выборках.Так как такие сообщества практически не встречаются, этого предположения следует избегать.

Теперь перейдем к разрежению по сэмплам. Наша задача состоит в том, чтобы найти аналитическое выражение для (1) средней кривой накопления при всех возможных перестановках всех выборок, то есть аналог формулы Херлберта (1971) для индивидуальных кривых накопления, и (2) соответствующую дисперсию, т. Е. аналог формулы Хека и др. (1975). Преимущество таких аналитических выражений состоит в том, что больше не потребуется повторная выборка с помощью методов Монте-Карло.

Важно отметить, что кривая накопления видового богатства в выборках определяется как среднее количество видов при всех возможных перестановках этих выборок. Таким образом, выборки независимы, поскольку они могут встречаться где угодно при случайной перестановке. Таким образом, кривая накопления будет просто средним числом видов в случайном наборе образцов из существующих образцов A (т.е. a – одно из целых чисел 1, 2, 3,…, A ).Когда это осознается, проблема 1 становится тривиальной. Сначала нам нужно небольшое переопределение параметров: A теперь является общим количеством выборок, а a – это размер случайной подвыборки, т.е. a – это одно из целых чисел 1, 2,…, A и n i – количество образцов, в которых наблюдается i -й вид. Кроме того, количество наблюдаемых видов во всех образцах A обозначено S obs .Поскольку количество любых видов в случайной подгруппе имеет гипергеометрическое распределение (Феллер, 1950), аргументы, приведенные Аррениусом (1921) (т. Е. Использование индикаторных функций, ожиданием которых является вероятность появления), приводят непосредственно к точному выражению для ожидаемого числа видов:

(уравнение 5)

Обратите внимание, что эта формула для средней кривой накопления при всех возможных перестановках образцов представляет собой математическое ожидание типа Аррениуса при выборке без замены и, следовательно, имеет ту же форму, что и кривые, полученные путем случайного размещения видов по сетке, разработанные ( Hurlbert 1971; Coleman 1981; Williamson 1988; и Ney-Nifle & Mangel 1999).Расширение биномиального отношения (вероятность отсутствия в случайно выбранной выборке):

(уравнение 6)

мы приходим к развернутой форме для среднего количества видов на каждом этапе накопления:

(уравнение 7)

Из этого выражения мы видим, что если общее количество выборок велико по сравнению с числом заселенности для каждого вида, n i << A , то:

(уравнение 8)

, что является выражением Арренхиуса (1921).Однако этот переход биологически нереалистичен, поскольку многие виды, вероятно, будут представлены более чем в 10–20% всех выборок, поэтому требование, чтобы n i / A было близко к нулю, является редко выполняется, и поэтому его следует избегать.

Для последующего анализа нам понадобится более компактная форма выражения кривой накопления. Пусть R k будет числом видов, которые наблюдаются точно в k выборках.Обратите внимание, что сумма R k s составляет S obs , поэтому частоты, R k / S obs = 1,…, A ) формируют распределение вероятностей, которое содержит информацию о том, как виды представлены в различных выборках, и поэтому мы называем это «распределением представлений». Кривая «вид – накопление» определяется как ожидаемое количество видов, E ( S a ), в случайном подмножестве из a = 1,…, A образцов.В Приложении I мы показываем, что среднее количество наблюдаемых видов в любой подгруппе выборок может быть выражено через количество видов S obs и репрезентативное распределение:

(уравнение 9)

Ковариационная структура встречаемости видов в общем случае сложна. Кроме того, недопустимо сводить проблему к биномиальному случаю, позволяя размеру выборки стремиться к бесконечности.Поэтому единственная возможность – использовать комбинаторные аргументы при разработке точной формулы ковариации. Поскольку это чисто статистическое упражнение, мы помещаем все аргументы и окончательное аналитическое выражение в Приложение I.

Точно так же сложно найти компактную формулу аппроксимации точной кривой накопления видов. Мы решили эту проблему, используя комбинацию линейной регрессии, численного анализа и аппроксимации бесконечными рядами.Поскольку это чисто математическое упражнение, мы помещаем все аргументы и окончательное аналитическое выражение в Приложение II.