关于后端:开源C语言库Melon数据恢复算法

57次阅读

共计 1739 个字符,预计需要花费 5 分钟才能阅读完成。

本文讲述开源 C 语言库 Melon 中的里德所罗门纠错码的应用。

对于 Melon 库,这是一个开源的 C 语言库,它具备:开箱即用、无第三方依赖、装置部署简略、中英文文档齐全等劣势。

Github repo

简介

里德所罗门编码是一种纠错码技术,常被用于网络传输丢包复原、磁盘 RAID 等畛域。

对于里德所罗门算法原理的具体解说,能够参考笔者以前的一篇文章《神奇的数据恢复算法》。

本文将次要利用 Melon 库实现的里德所罗门纠错码模块,配以实例代码,给大家直观展现纠错码的恢复能力。

应用

话不多说,咱们上代码,而后进行阐明:

#include <stdio.h>
#include <stdlib.h>
#include "mln_core.h"
#include "mln_log.h"
#include "mln_string.h"
#include "mln_rs.h"

int main(int argc, char *argv[])
{
    mln_rs_result_t *res, *dres;
    char origin[] = "AAABBBCCCDDD";
    uint8_t *err[6] = {0};
    mln_string_t tmp;
    struct mln_core_attr cattr;

    cattr.argc = argc;
    cattr.argv = argv;
    cattr.global_init = NULL;
    cattr.master_process = NULL;
    cattr.worker_process = NULL;
    if (mln_core_init(&cattr) < 0) {fprintf(stderr, "init failed\n");
        return -1;
    }

    res = mln_rs_encode((uint8_t *)origin, 3, 4, 2);
    if (res == NULL) {mln_log(error, "rs encode failed.\n");
        return -1;
    }

    err[0] = NULL;
    err[1] = NULL;
    err[2] = (uint8_t *)origin+6;
    err[3] = (uint8_t *)origin+9;
    err[4] = mln_rs_result_get_data_by_index(res, 4);
    err[5] = mln_rs_result_get_data_by_index(res, 5);

    dres = mln_rs_decode(err, 3, 4, 2);
    if (dres == NULL) {mln_log(error, "rs decode failed.\n");
        return -1;
    }

    mln_string_nset(&tmp, mln_rs_result_get_data_by_index(dres, 1), 3);
    mln_log(debug, "%S\n", &tmp);

    mln_rs_result_free(res);
    mln_rs_result_free(dres);
    return 0;
}

main中的代码行为如下:

  1. 定义变量,其中蕴含了原始数据origin,这个一围数组将被当作一个四行三列的矩阵应用。
  2. 初始化 Melon 库。
  3. 利用 mln_rs_encode 函数对原始数据 origin 这个四行三列的数据生成两个补码包。
  4. 模仿丢包,即抛弃了 AAA, BBB,而后保留了CCCDDD 以及两个补码包。留神:数据包的排列程序要与生成数据时保持一致,失落的数据要在对应的下标处理NULL
  5. 调用 mln_rs_decode 函数对 步骤 4 保留的内容进行数据修复,这里须要传入原始数据的行列数及补码包数量。
  6. 获得修复出的第二行数据,即 BBB 并输入。
  7. 开释生成和复原时的后果数据。

结语

能够看到里德所罗门编码有如下特色:

  1. 参加计算的数据必须都是等长的,如果不一样长,则要在其后补入数据放弃等长。
  2. 数据恢复时的数据程序必须与初始 encode 时的程序保持一致,本例中就是AAABBBCCCDDD
  3. 假如原始数据有 M 个,补码包生成 N 个,此时总数据包有 M + N 个,修复数据的要求是:这 M + N 个数据中失落任意 N 个或少于 N 个,原始数据都能够被复原。

相较于传统异或的纠错码,这种算法反对了失落多段数据的修复,但计算开销也会比异或要大一些,因而使用者应该针对本身应用场景进行抉择。

欢送各位对 Melon 感兴趣的读者拜访其 Github 仓库。

感激浏览!

正文完
 0