Sqlserver
 sql >> Baza danych >  >> RDS >> Sqlserver

Eliminowanie wartości odstających przez odchylenie standardowe w SQL Server

Jeśli założysz rozkład zdarzeń na krzywej dzwonowej, to tylko 68% wartości będzie mieścić się w zakresie 1 odchylenia standardowego od średniej (95% pokrywają 2 odchylenia standardowe).

Załadowałbym zmienną z odchyleniem standardowym twojego zakresu (uzyskaną przy użyciu stdev / stdevp sql), a następnie wybierz wartości, które mieszczą się w odpowiedniej liczbie odchyleń standardowych.

declare @stdtest table (colname varchar(20), colvalue int)

insert into @stdtest (colname, colvalue) values ('a', 2)
insert into @stdtest (colname, colvalue) values ('b', 4)
insert into @stdtest (colname, colvalue) values ('c', 4)
insert into @stdtest (colname, colvalue) values ('d', 4)
insert into @stdtest (colname, colvalue) values ('e', 5)
insert into @stdtest (colname, colvalue) values ('f', 5)
insert into @stdtest (colname, colvalue) values ('g', 7)
insert into @stdtest (colname, colvalue) values ('h', 9)

declare @std decimal
declare @mean decimal
declare @lower decimal
declare @higher decimal
declare @noofstds int

select @std = STDEV(colvalue), @mean = AVG(colvalue) from @stdtest

--68%
set @noofstds = 1
select @lower = @mean - (@noofstds * @std)
select @higher = @mean + (@noofstds * @std)

select @lower, @higher, * from @stdtest where colvalue between @lower and @higher

--returns rows with a colvalue between 3 and 7 inclusive

--95%
set @noofstds = 2
select @lower = @mean - (@noofstds * @std)
select @higher = @mean + (@noofstds * @std)

select @lower, @higher, * from @stdtest where colvalue between @lower and @higher

--returns rows with a colvalue between 1 and 9 inclusive


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SQL Server 2016:Utwórz bazę danych

  2. Jak mogę zrobić klucz podstawowy jako AUTOINCREMENT?

  3. Wywołanie procedury składowanej z typem danych XML

  4. wybierz pogorszenie wydajności instrukcji podczas korzystania z DISTINCT z parametrami

  5. Zaszyfruj dane kolumn za pomocą LINQ