查看原文
其他

数据包络分析(DEA):效率比较,而且可以自动分配权重!

王海华 模型视角 2023-09-24

在对各种评价对象(如企业、项目、机构等)的效率进行评价时,一个直观且常用的方法是简单地采用产出与投入的比率。例如,一个公司可能会使用其总收入(产出)与其总成本(投入)之比来衡量其效率。然而,这种方法有一个明显的缺点:当我们面临多种输入和多种输出的情况时,如何为各个输入和输出分配恰当的权重成为了一个问题。此外,这种方法还无法处理非线性关系或受到外部因素影响的情况。面对这些挑战,学者们发明了数据包络分析(DEA)。与传统的效率评价方法相比,DEA的优势在于它可以处理多输入和多输出的情境,并自动为它们分配最优的权重,从而提供一个更全面、更准确的效率评价

1. DEA 的基本概念

考虑有 个决策单元。每个决策单元 使用 种输入 (例如,盗本、劳动力) 产生 种输 出。

  • : 表示第 个决策单元的第 种输入量。
  • : 表示第 个决策单元的第 种输出量。

我们的目标是评估每个决策单元的相对效率。

2. DEA 的数学模型

2.1 基本模型

为了评估第 个决策单元的效率,我们可以使用以下线性规划模型:

约束条件为:

其中:

  • 是权重,它们代表第 种输出和第 种输入的重要性。
  • 代表第 个决策单元的相对效率。

2.2生产前沿线

在DEA中,生产前沿线(Production Possibility Curve,PPF)代表了最佳实践或最高效率的集合。具体来说,它是一个由那些效率达到最大的决策单元组成的集合。这些决策单元在给定的输入下能够产生最大的输出,或者在给定的输出下使用最少的输入。

生产前沿线上的决策单元被认为是有效的,因为它们与最佳实践相匹配或者已经达到了最佳实践。而生产前沿线以下的决策单元被认为是无效的,因为在同样的条件下,它们的效率没有达到最佳实践。

通过DEA模型,我们可以确定哪些决策单元在生产前沿线上,哪些决策单元在生产前沿线以下。此外,通过分析生产前沿线,我们还可以识别哪些决策单元具有潜在的改进空间,以及如何改进。

2.3 数学模型解读

  • 目标函数:这里的目标函数试图最大化决策单元 的加权输出。权重 代表了每种输出的 相对重要性。因此, 可以被理解为决策单元 的总加权输出。

  • 约束1:该约束确保了决策单元 的加权输入总和为 1 。这是一个标准化约束,它确保了在不同的决策单元之间进行比较时,模型的结果是可比的。

  • 约束2:这个约束确保任何其他决策单元 的加权输出与加权输入之差不超过0。简单来说, 它确保了其他所有的决策单元的效率不超过被评估的决策单元 。如果 是有效的,那么它的效率会与生产前沿线相匹配或超过其他所有的决策单元。

  • 约束3:权重必须是非负的,这确保了模型的实际意义和合理性。

DEA的数学模型是在没有明确的生产函数或效率标准的情况下,通过比较各个决策单元的相对效率来评估它们的效率。这种方法特别适用于多输入和多输出的情境。

如果 ,那么第 个决策单元是有效的;如果 ,那么第 个决策单元是无效的。

3. DEA 的应用

DEA 的主要优点是它不需要预先确定输入和输出的权重,而是根据数据来确定权重。这使得 DEA 特别适合于那些没有明确生产函数的情境,例如教育、医疗和公共服务。

3.1案例:医院效率评估

假设我们要评估三家医院的效率。每家医院的输入包括医生人数和医院开销,而输出则是每年的病人治愈人数。

医院医生人数 (输入医院开销(输入,单位: 百万)病人治舁人数(输出)
A1051000
B1571300
C84800

我们希望使用DEA方法来评估这三家医院的效率。

求解:

为了评估医院A的效率,我们可以建立以下DEA模型:

约束条件为:

我们可以使用线性规划工具来求解上述模型,并获取权重 。然后,我们可以使用 相同的方法来评估医院B和医院C的效率。

3.2 代码实现

下面是python代码

import pulp

def DEA_evaluation(input_data, output_data, inputs, outputs):
    """
    使用DEA方法评估决策单元的效率。
    
    参数:
    - input_data: 输入数据的字典。键是决策单元的名称,值是与指定输入相对应的列表。
    - output_data: 输出数据的字典。与input_data格式相同。
    - inputs: 输入的名称列表。
    - outputs: 输出的名称列表。
    
    返回:
    一个字典,键是决策单元的名称,值是该决策单元的效率。
    """

    
    # 获取决策单元的数量
    n = len(input_data)
    
    # 结果字典
    efficiencies = {}
    
    for dm in input_data.keys():
        # 创建线性规划问题
        prob = pulp.LpProblem("DEA", pulp.LpMaximize)
        
        # 创建变量
        v = pulp.LpVariable.dicts("v", inputs, lowBound=0)
        u = pulp.LpVariable.dicts("u", outputs, lowBound=0)
        
        # 创建目标函数
        prob += pulp.lpSum([u[r] * output_data[dm][r] for r in outputs]), "Objective"
        
        # 添加约束
        prob += pulp.lpSum([v[i] * input_data[dm][i] for i in inputs]) == 1"Standardization"
        
        for dmu in input_data.keys():
            prob += pulp.lpSum([u[r] * output_data[dmu][r] for r in outputs]) - pulp.lpSum([v[i] * input_data[dmu][i] for i in inputs]) <= 0f"Efficiency_{dmu}"
        
        # 解决问题
        prob.solve()
        
        # 存储效率值
        efficiencies[dm] = pulp.value(prob.objective)
    
    return efficiencies

# 使用案例数据进行测试
input_data = {
    'A': {'医生人数'10'医院开销'5},
    'B': {'医生人数'15'医院开销'7},
    'C': {'医生人数'8'医院开销'4}
}

output_data = {
    'A': {'病人治愈人数'1000},
    'B': {'病人治愈人数'1300},
    'C': {'病人治愈人数'800}
}

inputs = ['医生人数''医院开销']
outputs = ['病人治愈人数']

DEA_evaluation(input_data, output_data, inputs, outputs)

结果为

{'A': 1.0, 'B': 0.9285714230000001, 'C': 1.0} 

3.3 结果解读

医院A和医院C都位于生产前沿线上,它们的效率为1,即它们的效率达到了最佳实践。医院B位于生产前沿线以下,这意味着它的效率低于最佳实践。其效率值为0.93,这表示它与生产前沿线存在7%的差距,因此还有7%的改进空间。

DEA 的主要局限性是它只能评估相对效率,而不能评估绝对效率。此外,DEA 对异常值非常敏感。

4. DEA 模型的变体

尽管经典的DEA模型在很多情境下都很有用,但在某些特定的应用场景中,可能需要对模型进行一些调整或改进。以下介绍了几种常见的DEA模型变体:

4.1 加权DEA

在经典的DEA模型中,所有的输入和输出变量都被认为是同样重要的。但在某些情况下,某些输入或输出可能比其他的更重要。加权DEA允许决策者为不同的输入和输出设置不同的权重,从而更好地反映其在实际运营中的重要性。

4.2 网络DEA

传统的DEA模型考虑了决策单元的总体输入和输出,但它没有深入到决策单元的内部操作。网络DEA模型将决策单元的操作划分为几个子过程或阶段,每个子过程都有自己的输入和输出。这允许分析者更深入地了解决策单元的内部效率。

4.3 动态DEA

而传统的DEA模型是静态的,只考虑了一个特定时间点的效率。而动态DEA模型考虑了一段时间内的效率,这对于分析和比较长期运营的效率非常有用。

4.4 带有不良输出的DEA

在某些情况下,决策单元可能会产生不良输出,例如污染或浪费。这种模型变体允许同时考虑良好和不良的输出,从而提供了一个更全面的效率评估。

4.5 跨效率DEA

当需要比较来自不同数据集的决策单元的效率时,可以使用跨效率DEA。这使得可以将不同的决策单元放在同一个效率尺度上,从而进行比较。


数据包络分析很强大,可以帮助我们理解和比较决策单元的效率。通过 DEA,我们可以识别出低效的决策单元,并找出它们的不足之处,从而提高整体的效率。

参考文献

Charnes, A., Cooper, W. W., & Rhodes, E. (1978). Measuring the efficiency of decision making units. European Journal of Operational Research, 2(6), 429-444.

Emrouznejad, A., & Yang, G. L. (2018). A survey and analysis of the first 40 years of scholarly literature in DEA: 1978–2016. Socio-Economic Planning Sciences, 61, 4-8.


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存