Форум » Полезное » Про статистику » Ответить

Про статистику

Дмитрий: Мы все понемножку используем стат.методы. Каждый в силу своему ума и знаний. Вот я нашел интересные ссылки ГОСТ Р 50779.10-2000 (ИСО 3534.1-93)СТАТИСТИЧЕСКИЕ МЕТОДЫ. ВЕРОЯТНОСТЬ И ОСНОВЫ СТАТИСТИКИ. Термины и определения. ГОСТ Р ИСО 5479-2002Статистические методы. ПРОВЕРКА ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ. Сравнительный анализ критериев проверки нормальности одномерных величин еще есть гост ГОСТ 08.011-72, но его не нашел А тут меня ткунули носом в критерий Шапиро-Уилка, что мол он не показывает нормальность, а я написал что нормальная выборка. А теперь я могу сослаться на ГОСТ, и сказать что критерий Шапиро-Уилка в даном случае не применим. так как выбора n=5, а гост говорит о применени это критерия при 8<n<50. Так что эксперт, как и ожидалось, просто умом (котрый у него отсутсвует) блистать захотел,

Ответов - 52, стр: 1 2 3 All

Владимир Б.: Спасибо за ссылки

Kikinda: Ссылки действительно очень хорошие. А что это за критерий? Я про такой не знаю. Каким образом проверить малую выборку на нормальность распределения? Полагаю, что это важно не только для оределения стоимости, но и для согласования итоговых результатов. Кажется у Лейфера Л.А. были публикации по оценке через маленькую выборку, а у Баринова Н.П. по оценке выборки. Так ли уж важно, чтобы выборка была нормально распределена?

Владимир Б.: Я думаю, что более важным для оценщика является установить симметричность распределения


Дмитрий: Kikinda пишет: А что это за критерий? Я про такой не знаю. Да есть такой. А если учсть что он по умолчанию считается в программах по статистике. То знать про него нужно. Но у него есть ограничения: 1. По госту его можно использовать при выборке не менее 8 (но это конечно не аргумент для нормальных людей, а для чиновников от оценке пойдет) 2. Этот тест на нормальность на малых выборках очень чуствителен к выбросам, и поэтому он может (существует большая вероятность) из-за ненормальных значений (выбросов) дать не верный вывод о ненормальности выборки. То есть достоверность (мощность) этого критерия на малых выборках мала. 3. Кроме того, по теории этот тест производится не по выборочной дисперсии, а по дисперсии генеральной совокупности. При использовании выборочной дисперсии делается поправка, которая то же может вносить искажения в вывод о нормальности Я лично считаю асиметрю и эксцес. По большому счету для оценки действительно, как верно отметил Владимир Б. пишет: Я думаю, что более важным для оценщика является установить симметричность распределения важно смещение. А там треугольное, нормальное или экспоненциальное или еще какое симетричное распределение не фажно, потому что средняя и мат ожидание совпадет. С показателем асиметрии интересно, можно оценить завышен или занижен результат, по сравнению со средней. И сделать соответствющий вывод, полезный для пользователя Ну например: человек покупает, и ему в отчете пишем, что показатель асиметрии положителен, что означает, что наш результат скорее занижен, чем завышен, что для покупателя хорошо (для банка тоже хорошо)

Владимир Б.: Дмитрий Я, собственно, имел в виду, что более важны критерии, которые позволяют заменить моду матожиданием

andrey: А у меня вопрос. 1. В одном талмуде читаю" "Принято считать, что асимметрия выше 0,5 (независимо от знака) считается значимой; если она меньше 0,25, не незначимой." 2. В другом источнике: "Если отношение коэффициента асимметрии к величине стандартной ошибки асимметрии меньше 3 (трех), то асимметрия считается несущественной." Пример из жизни: количество наблюдений 7; коэф. асимметрии 0,93 (по первому утверждению - асимметрия значима); станд.ошибка асимметрии 0,67 (согласно второго утверждения - асимметрия незначима, т.к. 0,93/0,67 менее 3).

Дмитрий: Владимир Б. пишет: Я, собственно, имел в виду, что более важны критерии, которые позволяют заменить моду матожиданием Моды может и не быть. А матожидание есть всегда andrey пишет: Если отношение коэффициента асимметрии к величине стандартной ошибки асимметрии меньше 3 (трех), то асимметрия считается несущественной если меньше трех то отвергать гипотезу о нормальности нельзя и можно брать среднее арифметическое

andrey: Дмитрий Списибо, Дима!

Дмитрий: да забыл нужно что и про эксцесс то же самое можно было сказать что отношение показателя к свой ошибке меньше трех Что интересно, показатель отношения эксцесса к своей ошибке дает значение много больше трех если все аналоги равны. Вроде бы вот оно счастье цены всех аналогов кучно легли.

andrey: Дмитрий пишет: про эксцесс то же самое можно было сказать что отношение показателя к свой ошибке меньше трех Спасибо, я знаю этот критерий из второго источника. А в первом талмуде о критерии значимости ни гу-гу. Потому и спрашивал об асимметрии. Дмитрий пишет: Что интересно, показатель отношения эксцесса к своей ошибке дает значение много больше трех если все аналоги равны. Дык понятно, дисперсия-то к нулю стремится. А если соблюдается равенство цен аналогов так, вообще, ноль. Та же фигня и с асимметрией будет.

Kikinda: Я умею эксцесс считать руками. Экселем еще не пробовала. А вообще выборку проверяю привычным критериями - размах вариации, R2, дисперсия, мода, медиана. И по этим показателям делаю выводы. После первого применения отбрасываю некоторые крайние значения и проверяю еще раз. Очень неплохо дает представление о нормальности график остатков. Интересно, а ассиметрия что даст? Ну хорошо, выборка ассиметрична, а дальше что?

Дмитрий: Эх, нет Николай Петровича на вас. Попробую ответить в силу своих знаний. Вариация это показатель однородности (ну аналоги из одного сегмента или разных), к нормальности имеет отношение но не особо. R2 это вообще к регрессиям отношение имеет, к нормальности никакого. дисперсия, ну и что. но попали все аналоги в 3сигмы и что? Возможно нормальная выборка а может и не нормальная. 3-2-1,96 сигмы это проверка на выбросы. Но опять смотря что отбросить. Можно макс а можно мин. И результат разный получиться График остатков опять о регрессии, для проверки нормальности там не много другой график, но и выборка должна быть побольше а не любимые 5 аналогов Если асимметрия есть, то значит выборочное среднее отличается от матожидания. И значит если брать выборочную среднюю, то возможно завышение или занижение итога. Причем можно сразу сказать что именно. Мы посчитали цену, как выборочную среднюю, получили 100 ед. А горб на 120. Значит высока вероятность что цена объекта занижена. И если мы считаем для покупателя или как залог, то это для них хорошо, они на деньги не попадут. А скорее всего и на варят еще. а может и нет

Владимир Б.: Дмитрий пишет: Моды может и не быть. А матожидание есть всегда Именно поэтому важны критерии, которые дают оценщику основания использовать вместо моды (а именно эту величину велит определять ст.3 закона 135-ФЗ) - матожидание. Я об этом, собственно

Дмитрий: Владимир Б. пишет: а именно эту величину велит определять ст.3 закона 135-ФЗ ну что велит эта статья моду считать, это еще бабушка на двое сказала (почему кстати на двое?). Я считаю что там использовался не мат.термин, а обиходное выражение. Но это уже обсуждалось тут.

Владимир Б.: К каким чудесам приводит "обиходное" толкование терминов в АНЭИ - нам тут уже продемонстрировали. А вот Горбунов, к примеру, понятие "эффективный возраст" трактует как период времени, в течение которого актив приносит доход. Всё это крайне интересно, но давайте не будем уподобляться шолоховскому деду Щукарю - и не домысливать своих трактовок терминов вразрез с общепринятыми. Иначе у нас тут вообще будем не форум, а Вавилонская башня в момент разделения языков

Kikinda: А если выборка из 3-х аналогов то это выборка? А если из одного? Конечно, анализ выборки все таки лучше делать, чем не делать, но прежде, чем собирать выборку надо бы подумать над правилами по которым мы берем аналоги.

avg: Kikinda пишет: А вот Горбунов, к примеру, понятие "эффективный возраст" трактует как период времени, в течение которого актив приносит доход. Где я такое писал?

Дмитрий: Kikinda пишет: прежде, чем собирать выборку надо бы подумать над правилами по которым мы берем аналоги. Да это важно. особенно если учесть, то формирование выборки должно быть независимымое от наблюдателя. То есть по хорошему нужно наугад тыкать пальцем в газету с объявлением и так формировать выборку. А когда выборка формируется изтех элементов, какие понравились, то это уже неправильно А если учесть, что основные формулы написаны для повторяющейся выборки. То есть когда выбранный элемент возвращается в генеральную совокупность и может быть выбран еще раз. Kikinda пишет: А если выборка из 3-х аналогов то это выборка? Есть формулки и правила о достаточности элементов в выборке в зависимости от заданного уровня надежности и прочее Мне нравиться книжка Спирина А.А. (формат дежавю с распознаным тестом) хоть вручную считай. это новое издание avg пишет: Где я такое писал? Вы тут того, ветку не засоряйте

Владимир Б.: Критику принимаю. Тут и без нас засорянцев хватает

Мисовец: Коллеги, возможно я сейчас напишу то, что многие и так знают, но по итогам своих семинаров по регрессии я сталкивался с непониманием оценщиков места нормальности/асимметричности в регрессионном анализе. Суть в чем? Собираем мы аналоги двухкомнатных квартир в многоэтажных домах, стараемся, чтобы был один район, один материал (например панель), один диапазон по этажности, ну и грубо одинаковое состояние квартир по возрасту/отделке. ОК, собрали таких 10 аналогов. Тогда надо проверять выборку на нормальность/асимметричность? Вы скажете да, так нет, потому что доказано, что цены квадратного метра площади в такой выборке линейно зависят от площади согласно уравнению Ц = Ц0 + а1*S, да-да, рост стоимости метра с ростом площади, но притом, что квартира остается типовой двухкомнатной. А раз цены тут зависят от площади, то они вовсе не обязаны быть распределены нормально и симметрично, потому тут много средних, т.к. для каждой площади будет своё среднее, может быть распределенное нормально, а может нет, но своё. Поэтому надо не критерии применять, а строить регрессию, ну а там, если хочется, можно и нормальность проверить, благо в меню сервис/анализ данных/регрессия можно график нормального распределения заказать и с прямой линией его сравнить, например по значимости R2 по критерию Фишера, хотя в последнем я не уверен, честно говоря, насколько там Фишер полезен надо бы у НП спросить.... Ну а поскольку у нас это типичная ситуация, что цены аналогов не случайны, а зависят от факторов ценообразования, то данные госты и критерии они нам скорее отвлечение от сути, чем реальная помощь при оценке.



полная версия страницы