
2023年广东省渔业经济总产值约为2005.3亿元,占广东省生产总值(GDP)的比重约为1.45%,这表明渔业已经成为广东省区域经济发展的重要支柱,为广东省生产总值(GDP)的持续增长贡献了巨大的力量。然而,随着广东省渔业规模的持续扩大,其发展仍面临着诸如:产业链协同不足、水产资源约束加剧以及精深加工技术薄弱等问题。为了推动广东省渔业经济高质量可持续发展,同时为广东省渔业经济政策的精准制定提供科学依据,以集中各类资源重点解决制约广东省渔业经济发展的领域,亟须对广东省渔业经济发展的影响因素进行研究。
文/郑济坤
一、国内研究现状
目前国内关于水产业和渔业发展的研究较为丰富,且研究方向多集中于水产业和渔业发展现状及影响因素方面。
在关于水产业和渔业发展现状的研究方面,有研究指出可以从完善市场监管体系、发展海洋科技和发展渔业二、三产业等方面推动中国海洋渔业转型。另有研究提出要从探索水权交易机制和完善技术、土地、投融资等配套政策等方面促进衢州市水产业循环经济发展。还有研究经过分析发现广东省水产品加工业面临产业链协同效应不足和产业技术创新能力相对不足等问题,并提出广东省水产品加工业应建设水产业精深加工业服务体系和创新水产品精深加工联农助农经营模式等建议。
在关于水产业和渔业发展影响因素的研究方面,有研究认为影响中国水产品出口最重要的因素分别是水产品产量、全国水产养殖面积和渔业从业人员数量。有研究提出我国水产业应创新水产品数字化管理,形成水产品新质生产力和强化水产品贸易监控与预警。另有研究发现2024—2025年中国渔业贸易发展的主动力为共享效率和创新驱动维度的因素,2025年中国渔业贸易发展的主动力为绿色持续和协调融合维度的因素。
这些研究成果为我国水产业和渔业的可持续发展提供了重要的理论依据和实践指导,有助于推动产业升级和高质量发展,促进渔业资源的合理利用和生态环境的保护。
二、机器学习模型的构建
(一)模型指标选取
本文以广东省渔业总产值来表示广东省渔业经济发展水平,并以此作为模型的被解释变量。在模型的解释变量选取方面,本文通过中国渔业统计年鉴和万德数据库,选取2006-2023年代表广东省渔业基础设施、渔业生产要素、渔业组织效率、渔业科技创新推广能力和渔业关联产业发展情况5个方面的17个指标作为广东省渔业经济发展的影响因素。
(二)样本划分与数据预处理
机器学习模型的构建需要将样本总体划分为训练集和测试集两个部分,训练集数据主要用于构建机器学习模型,测试集数据则主要用于对基于训练集构建的机器学习模型性能进行检验。本文将80%的总体样本数据划分为训练集,剩余的20%数据划分为测试集。在数据的标准化处理方面,本文主要采用标准差标准化法,让拥有不同量纲和尺度的数据特征列能够更好地被模型学习。
(三)模型评价指标选取
本文选取RMSE作为模型的评价指标,该指标在计算过程中采用了开根号的形式,进而避免计算结果出现单位的平方问题。RMSE指标取值越小,越接近0,表明模型对测试集数据的预测效果越好,反之RMSE指标取值越大,则表明模型对测试集数据的预测效果越差。
(四)支持向量级模型的构建
本文主要构建线性核模型和径向核模型这两类支持向量级模型,并基于RMSE指标对两类模型的预测能力进行比较。本文利用网格搜索法对两类模型各自的最优超参数组合进行选取。根据选取的最优超参数组合所训练的线性核模型和径向核模型的RMSE指标取值分别为0.084和0.078,表明径向核模型对测试集数据的预测效果较好。
(五)神经网络模型的构建
本文主要构建单隐藏层和双隐藏层两类神经网络模型,并基于参数遍历法对两类模型最优的隐藏层神经元数量i进行选取。参数遍历的结果表明单隐藏层模型最佳的神经元数量i为43,双隐藏层模型每一层最佳的神经元数量i为95。在此基础上,计算单隐藏层和双隐藏层两类神经网络模型各自的RMSE分别为0.037和0.022,表明双隐藏层模型对策试集数据的预测能力较强。
(六)随机森林模型的构建
本文主要构建了参数max_features分别取值为“sqrt”和“None”的两类随机森林模型。对两类模型的RMSE指标进行计算,其结果表明对于max_features取值为“None”的随机森林模型,其RMSE指标为0.102。对于max_features取值为“sqrt”的随机森林模型,其RMSE指标为0.108。因此,基于RMSE指标的结果,参数max_features取值为“None”的随机森林模型预测能力较强。
三、影响因素指标解释力度分析
基于机器学习模型的构建情况,本文将以预测能力较好的径向核模型、双隐藏层模型和参数max_features取值为“None”,参数n_estimators取值为30的随机森林模型为基础,使用SHAP工具开展指标解释力度分析。
(一)支持向量机模型指标解释力度分析
对支持向量机径向核模型进行广东省渔业经济发展影响因素指标解释力度分析和排序,其结果表明在支持向量机模型中对广东省渔业经济发展影响最大的前5个因素指标分别是机动渔船年末拥有量、捕捞渔船年末拥有量、生产渔船年末拥有量、水产加工企业数量和渔民人均纯收入。
(二)神经网络模型指标解释力度分析
对神经网络双隐藏层模型进行指标解释力度分析和排序,其结果表明在神经网络模型中对广东省渔业经济发展影响最大的前5个因素指标分别是渔民人均纯收入、渔用机具制造业总产值、生产渔船年末拥有量、水产品加工量和港口码头泊位数。
(三)随机森林模型指标解释力度分析
对随机森林模型进行指标解释力度分析和排序,其结果表明在随机森林模型中对广东省渔业经济发展影响最大的前5个因素指标分别是机动渔船年末拥有量、水产品养殖面积、水产技术推广经费、生产渔船年末拥有量和港口货物吞吐量。
四、结论与建议
(一)结论
综合以上指标解释力度分析的结果,可以发现对广东省渔业经济发展影响程度最大的指标是生产渔船年末拥有量,该指标在三类机器学习模型的分析结果中都属于影响程度最大的前5个指标中。机动渔船年末拥有量和渔民人均纯收入指标都在两类机器学习模型的指标解释力度分析结果中属于影响程度最大的前5个指标中,因此其对广东省渔业经济发展的影响重要性程度较强。其余指标由于只属于一类机器学习模型分析结果中影响程度最大的前5个指标之一,因此其对广东省渔业经济发展的影响重要性程度相对较小。
(二)建议
本文影响因素指标解释力度分析的结果明确了不同影响因素指标对渔业经济发展的影响重要性程度。基于以上研究结论,本文提出以下几点建议。
首先,由于生产渔船年末拥有量是对广东省渔业经济发展影响程度最大的因素,因此广东省应该加强对生产渔船的管理,合理规划生产渔船的数量与规模,依据渔业资源状况和市场需求,科学制定渔船建造与更新计划,提高渔船的使用效率。
其次,机动渔船年末拥有量对广东省渔业经济发展影响程度较大,因此广东省应优化机动渔船配置建立针对机动渔船的动态管理机制,根据不同海域、季节和作业类型的实际需求,灵活调配机动渔船资源。
最后,渔民人均纯收入对广东省渔业经济发展具有较大影响,其和渔业工作从业者的生产积极性直接挂钩,因此,广东省应出台更多扶持政策,加大对渔民的补贴力度,包括燃油补贴、渔业保险补贴等,减轻渔民的生产负担。此外,政府还可以鼓励渔民发掘多种渔业经营渠道,如发展休闲渔业、水产品加工业等,提高渔民的综合收入。
(作者单位:岭南师范学院商学院)
审核:刘 坤
责编:明贵栋
编辑:刘 彬