¬се бесплатно
    ¬се ссылки на файлы, расположенные на страницах сайта, добавлены пользовател€ми и доступны дл€ бесплатного скачивани€. «а содержание этих файлов администраци€ сайта ответственности не несет.



¬опросы
   -во рабочих дней в мес€це
    атегори€: ћатематика
  —оздать индекс дл€ таблицы ABS (Absolute Database)
    атегори€: Ѕазы данных
  ќпределить ћј—-адрес карты
    атегори€: »нтернет и —ети
  Wav файл внутри exe-файла
    атегори€: ‘айлова€ система
  ѕерекодировка в DBASE
    атегори€: Ѕазы данных
   ак нарисовать календарь
    атегори€: “екст и строки
  ”паковать TinyDB
    атегори€: Ѕазы данных
   омпоненты ToolBar и PageScroller
    атегори€:  омпоненты
   омпоненты TrackBar и ScrollBar
    атегори€:  омпоненты
   ак поместить графический элемент в ListBox
    атегори€:  омпоненты

Delphi - Ѕаза «наний: –аспознавание кодировки. ѕерекодировка.

  << ¬ернутьс€ к —одержанию  

јлгоритм распознавани€ кодировки нужен дл€ автоматического декодировани€ текста. Ётот алгоритм основан на том, что некоторые буквы русского алфавита встречаетс€ очень часто, а некоторые редко. ѕоскольку этот способ статистический, то лучше всего он работает с большими текстами.

type
  TCode = (win, koi, iso, dos);

const
  CodeStrings: array [TCode] of string = ('win','koi','iso','dos');

procedure TForm1.Button1Click(Sender: TObject);
var
  str: array [TCode] of string;
  norm: array ['ј'..'€'] of single;
  code1, code2: TCode;
  min1, min2: TCode;
  count: array [char] of integer;
  d, min: single;
  s, so: string;
  chars: array [char] of char;
  c: char;
  i: integer;
begin
  so := Memo1.Text;

  norm['ј'] := 0.001;
  norm['Ѕ'] := 0;
  norm['¬'] := 0.002;
  norm['√'] := 0;
  norm['ƒ'] := 0.001;
  norm['≈'] := 0.001;
  norm['∆'] := 0;
  norm['«'] := 0;
  norm['»'] := 0.001;
  norm['…'] := 0;
  norm[' '] := 0.001;
  norm['Ћ'] := 0;
  norm['ћ'] := 0.001;
  norm['Ќ'] := 0.001;
  norm['ќ'] := 0.001;
  norm['ѕ'] := 0.002;
  norm['–'] := 0.002;
  norm['—'] := 0.001;
  norm['“'] := 0.001;
  norm['”'] := 0;
  norm['‘'] := 0;
  norm['’'] := 0;
  norm['÷'] := 0;
  norm['„'] := 0.001;
  norm['Ў'] := 0.001;
  norm['ў'] := 0;
  norm['Џ'] := 0;
  norm['џ'] := 0;
  norm['№'] := 0;
  norm['Ё'] := 0.001;
  norm['ё'] := 0;
  norm['я'] := 0;
  norm['а'] := 0.057;
  norm['б'] := 0.01;
  norm['в'] := 0.031;
  norm['г'] := 0.011;
  norm['д'] := 0.021;
  norm['е'] := 0.067;
  norm['ж'] := 0.007;
  norm['з'] := 0.013;
  norm['и'] := 0.052;
  norm['й'] := 0.011;
  norm['к'] := 0.023;
  norm['л'] := 0.03;
  norm['м'] := 0.024;
  norm['н'] := 0.043;
  norm['о'] := 0.075;
  norm['п'] := 0.026;
  norm['р'] := 0.038;
  norm['с'] := 0.034;
  norm['т'] := 0.046;
  norm['у'] := 0.016;
  norm['ф'] := 0.001;
  norm['х'] := 0.006;
  norm['ц'] := 0.002;
  norm['ч'] := 0.011;
  norm['ш'] := 0.004;
  norm['щ'] := 0.004;
  norm['ъ'] := 0;
  norm['ы'] := 0.012;
  norm['ь'] := 0.012;
  norm['э'] := 0.003;
  norm['ю'] := 0.005;
  norm['€'] := 0.015;

  Str[win] := 'јаЅб¬в√гƒд≈е∆ж«з»и…й кЋлћмЌнќоѕп–р—с“т”у‘ф’х÷ц„чЎшўщЏъџы№ьЁэёюя€';
  Str[koi] := 'юёајбЅц÷дƒе≈ф‘г√х’и»й…к лЋмћнЌоќпѕ€яр–с—т“у”ж∆в¬ь№ыџз«шЎэЁщўч„ъЏ';
  Str[iso] := '–р—с“т”у‘ф’х÷ц„чЎшўщЏъџы№ьЁэёюя€аєбЄв—Тг—УдЇе—Хж≥зњи—Шй—Щк—Ъл—Ым—Ьн¬Іо—Юп—Я';
  Str[dos] := '–В –Г–ОвАЪ—Ю—У–И"¬§вА¶•вА†¬¶вА°¬ІвВђ®вА∞¬©–Й™вАє"–К–М–Л¬Ѓ–Пѓ—Та'б'в"г"дoе-ж-зивДҐй—ЩквАЇл—Ъм—Ьн—Ыо—Япз?ивДҐй—ЩквАЇл—Ъм—Ьн—Ыо—Яп';
  for c := #0 to #255 do
    Chars[c] := c;

  min1 := win;
  min2 := win;
  min := 0;
  s := so;
  fillchar(count, sizeof(count), 0);
  for i := 1 to Length(s) do
    inc(count[s[i]]);
  for c := 'ј' to '€' do
    min := min + sqr(count[c] / Length(s) - norm[c]);
  for code1 := low(TCode) to high(TCode) do
  begin
    for code2 := low(TCode) to high(TCode) do
    begin
      if code1 = code2 then
        continue;

      s := so;
      for i := 1 to Length(Str[win]) do
        Chars[Str[code2][i]] := Str[code1][i];
      for i := 1 to Length(s) do
        s[i] := Chars[s[i]];
      fillchar(count, sizeof(count), 0);
      for i := 1 to Length(s) do
        inc(count[s[i]]);
      d := 0;
      for c := 'ј' to '€' do
        d := d + sqr(count[c] / Length(s) - norm[c]);
      if d < min then
      begin
        min1 := code1;
        min2 := code2;
        min := d;
      end;
    end;
  end;

  s := Memo1.Text;
  if min1 <> min2 then
  begin
    for c := #0 to #255 do
      Chars[c] := c;
    for i := 1 to Length(Str[win]) do
      Chars[Str[min2][i]] := Str[min1][i];
    for i := 1 to Length(s) do
      s[i] := Chars[s[i]];
  end;
  Form1.Caption := CodeStrings[min2] + ' ' + CodeStrings[min1];

  Memo2.Text := s;
end;
  << ¬ернутьс€ к —одержанию